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文艺 复兴 以 来 , 源远流长 的 科学 精神 和 逐步 形成 的 学 术 规范 ; 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 , 美国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ,: 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 , .我国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 遂 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著 名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L: 
Peterson 等 大 师 名 家 的 一 批 经 典 作品 ;以 “计算 机 科学 众 书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 , 还 不 辞 劳苦 地 担任 子 翻 译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 
两 百 个 品种 ， 这 些 书 籍 在 读者 中 树立 了 和 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 
联系 电话 : (010) 88379604 
联系 地 址 ， 北 京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 ，100037 华章 科技 图 书 出 版 中 心 
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计算 机 组 成 原理 与 系统 结构 是 计算 机 科学 与 技术 及 相关 专业 的 核心 基础 内 容 , 其 教学 效 
果 对 于 培养 学 生 的 计算 机 系统 能 力 具 有 很 大 的 影响 。 这 两 部 分 涉及 的 内 容 相 互 融合 ， 密 不 
可 分 。 越 来 越 多 的 国内 外 高 校 在 教学 设计 、 教 学 实施 、 教 材 编写 时 将 这 两 部 分 内 容 结合 在 一 
起 ， 并 取得 了 明显 的 效果 。 

本 书 的 英文 版 《 Computer Organization and Architecture: Themes and Variations 》 不 仅 覆 
盖 了 单机 系统 的 组 成 原理 和 系统 结构 的 各 个 方面 ， 还 包括 计算 机 的 性 能 评价 方法 及 多 发 射 、 
粗 粒度 并 行 等 内 容 。 作 者 希望 本 书 能 够 适合 电子 工程 ( EE)、 电 子 与 计算 机 工程 (ECE)、 计 
算 机 科学 ( CS) 等 不 同 专 业 的 教学 需要 。 书 中 国 绕 基本 概念 、 指 令 集 体系 结构 、 处 理 器 组 成 
和 和 能效、 存储 与 外 设 ， 以 及 处 理 器 级 并 行 等 五 个 核心 问题 将 这 些 内 容 有 条 不 率 地 组 织 在 一 
起 ， 以 便 满足 不 同 专业 的 教学 需要 。 

综合 考虑 国内 高 校 “ 计 算 机 组 成 与 结构 ”或 类 似 课程 的 教学 目标 以 及 我 们 对 本 书 的 定 
位 , 中文 纸 质 版 分 成 了 两 本 《计算 机 组 成 原理 》 和 《计算 机 存储 与 外 设 》。 

其 中 ,《 计 算 机 组 成 原理 》 涵 盖 原 书 的 前 三 部 分 (中文 版 《计算 机 组 成 原理 》 第 1 ~ 6 
章 分 别 对 应 原 书 第 1 章 : 第 2 章 前 8 节 、 B3~ 5 章 和 第 7 章 )。 

第 一 部 分 主要 介绍 计算 机 系统 的 组 成 、 体 系 结构 的 基本 概念 。 第 :I 章 介 绍 了 计算 机 组 成 
和 结构 的 有 关 概 念 、 计 算 机 的 发 展 历程 ,以 及 存储 程序 计算 机 ， 在 读者 面前 呈现 出 基本 存储 
程序 计算 机 系统 的 形象 。 第 2 章 则 讨论 了 数据 在 计算 机 中 的 表示 方法 和 运算 方法 ; 

第 二 部 分 介绍 了 指令 系统 的 概念 和 实例 。 这 部 分 包含 三 章 内 容 。 第 3 章 首先 介绍 .TSA 的 
基本 概念 ， 之 后 以 ARM 指令 集 为 例 介 绍 了 ISA 设计 时 需要 考虑 的 主要 问题 ， 如 指令 类 型 、 
寻 址 方式 、 数 据 表示 等 。 第 4 章 介绍 了 MIPS 一 一 另 一 个 经 典 的 RISC 指令 集 ， 以 增加 知识 
的 深度 和 广度 。 第 5 章 着 重 介 绍 了 当前 处 理 器 为 特定 领域 应 用 (比如 多 媒体 应 用 ) 提供 的 支 
持 ， 特 别 是 指令 集 的 支持 。 

第 三 部 分 介绍 了 处 理 器 的 实现 以 及 一 些 影响 处 理 器 性 能 的 因素 。 这 部 分 只 有 一 章 ， 即 第 
6 章 。 它 首先 介绍 了 设计 控制 器 的 两 种 经 典 方 法 一 一 微 程序 与 组 合 逻 辑 ， 然 后 讨论 了 流水 线 
技术 、 影 响 流 水 线性 能 的 因素 及 一 些 可 行 的 解决 方法 。 

本 书 即 为 《计算 机 存储 与 外 设 》 涵盖 原 书 的 第 四 部 分 (中文 版 《计算 机 存储 与 外 设 》 
第 1 一 4 章 分 别 对 应 原 书 的 第 9 ~ 12%), 介绍 了 计算 机 系统 中 的 存储 器 、 总 线 、 输 入 / 输 
出 等 内 容 。 第 1 章 介 绍 了 Cache 的 组 织 和 工作 原理 ， 以 及 虚 存 技术 。 第 2 ~ 3 章 涵盖 了 从 静 
态 半导体 存储 器 到 磁盘 和 光 存储 的 各 种 存储 技术 。 第 4 章 介 绍 了 IO 的 基本 工作 原理 以 及 总 
线 系统 ， 并 描述 了 一 些 支持 多 媒体 系统 的 现代 高 速 接口 。 

中 文 纸 质 版 没有 收录 原 书 中 的 门 和 数字 逻辑 、 性 能 评价 、 多 发 射 处 理 器 、 处 理 器 级 并 行 
等 内 容 〈 即 原 书 2.9 ~ 2.11 节 和 第 6、8、13 章 )， 因 为 这 些 内 容 一 般 会 在 “数字 逻辑 ”“ 计 算 
机 体系 结构 ”“ 计 算 机 系统 性 能 评价 ”等 课程 中 专门 介绍 。 有 兴趣 的 读者 可 以 在 中 文 版 出 版 


社 网 站 (http://www.hzbook.com) 上 找到 相关 章节 的 中 文 译文 。 

本 书 内 容 较 多 ， 翻 译 时 间 紧 迫 ， 尽 管 我 们 尽量 做 到 认真 仔细 ,但 还 是 难免 会 出 现 错误 和 
不 尽 如 人 意 的 地 方 。 在 此 欢迎 广大 读者 批评 指正 ， 我 们 也 会 及 时 在 网 上 更 新 勘误 表 ， 便 于 大 
家 阅读 。 


沈 立 
2016 年 12 月 于 长 沙 
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21 世纪 是 科学 和 技术 奇迹 频 出 的 时 代 。 计 算 机 已 经 做 到 了 人 们 期 望 它 做 到 的 一 切 一 一 其 
至 更 多 。 生 物 工 程 解 开 了 细胞 的 秘密 ， 使 科学 家 能 够 合成 10 年 前 无 法 想象 的 新 药 。 纳 米 技 
术 让 人 们 有 机 会 突 探 微观 世界 ， 将 计算 机 革命 与 原子 工程 结合 在 一 起 创造 出 的 纳米 机 器 人 ， 
也 许 有 一 天 能 够 植 人 人 人体， 修复 人 体内 部 的 创伤 。 普 适 计 算 带 来 了 手机 、MP3 播放 器 和 数码 
相机 ， 使 人 们 彼此 之 间 能 够 通过 Internet 保持 联系 。 计 算 机 是 几乎 所 有 现代 技术 的 核心 。 本 
书 将 阐述 计算 机 是 如 何 工 作 的 。 

从 20 世纪 50 年 代 起 大 学 就 开始 教授 这 门 被 称 为 计算 的 学 科 了 。 一 开始 ， 大 型 机 主导 了 
计算 ,这 个 学 科 包 括 对 计算 机 本 身 、 控 制 计算 机 的 操作 系统 、 语 言 和 它们 的 编译 器 、 数 据 库 
以 及 商业 计算 等 的 研究 。 此 后 ,计算 的 发 展 旦 指数 增长 ， 到 现在 已 包含 多 个 不 同 的 领域 ， 任 
何 一 所 大 学 都 不 可 能 完全 覆盖 这 些 领 域 。 人 们 不 得 不 将 注意 力 集 中 在 计算 的 基本 要 素 上 。 这 
一 学 科 的 核心 在 于 机 器 本 身 : 计算 机 。 当 然 ， 作 为 一 个 理论 概念 ， 计 算 可 以 脱离 计算 机 而 独 
立 存 在 。 实 际 上 ,在 20 世纪 三 四 十 年 代 计算 机 革命 开始 之 前 ， 人 们 已 经 进行 了 相当 多 的 关 
于 计算 机 的 科学 理论 基础 的 研究 工作 。 然 而 ， 计 算 在 过 去 40 年 里 的 发 展 方式 与 微 处 理 器 的 
崛起 紧密 联系 在 一 起 。 如 果 人 们 无 法 拥有 价格 非常 便宜 的 计算 机 ，Internet 也 无 法 按照 它 已 
有 的 轨迹 取得 成 功 。 

由 于 计算 机 本 身 对 计算 的 发 展 及 其 发 展 方向 产生 了 巨大 影响 ， 在 计算 的 课程 体系 中 包含 
一 门 有 关 计 算 机 如 何 工 作 的 课程 是 非常 合理 的 。 大 学 里 计算 机 科学 或 计算 机 工程 方向 的 培养 
方案 中 都 会 有 这 样 一 门 课程 。 实 际 上 ， 专 业 和 课程 的 认证 机 构 都 将 计算 机 体系 结构 作为 一 项 
核心 要 求 。 比 如 ， 计 算 机 体系 结构 就 是 IEEE 计算 机 协会 和 ACM 联合 发 布 的 计算 学 科 课程 
体系 的 中 心 内 容 。 

介绍 计算 机 具体 体现 与 实现 的 课程 有 各 种 各 样 的 名 字 。 有 人 将 它们 叫 作 硬 件 课 ， 有 人 管 
它们 叫 作 计算 机 体系 结构 ， 还 有 人 把 它们 叫 作 计 算 机 组 成 (以 及 它们 之 间 的 各 种 组 合 )。 本 
书 用 计算 机 体系 结构 表示 这 门 研究 计算 机 设计 方法 和 运行 方式 的 课程 。 当 然 ， 我 会 解释 为 什 
么 这 门 课程 有 那么 多 不 同 的 名 字 ， 并 会 指出 可 以 用 不 同 的 方式 来 看 待 计算 机 。 

与 计算 机 科学 的 所 有 领域 一 样 ， 计 算 机 体系 结构 也 随 着 指令 集 设 计 、 指 令 级 并 行 OLP) 
Cache 缓存 技术 、 总 线 系统 、 猜 测 执 行 、 多 核 计算 等 技术 的 发 展 而 飞速 进步 。 本 书 将 讨论 所 
有 这 些 话题 。 Ti al 

计算 机 体系 结构 是 计算 机 科学 的 基石 。 例 如 ,计算 机 性 能 在 今天 的 重要 性 超过 了 以 往 
任何 时 候 ， 为 了 做 出 最 佳 选择 ， 即 便 是 那些 购买 个 人 电脑 的 用 户 也 必须 了 解 计算 机 系统 的 
结构 。 

尽管 绝 大 多 数学 生 永 远 不 会 设计 一 台新 的 计算 机 ， 但 今天 的 学 生 却 需要 比 他们 的 前 辈 更 
全 面 地 了 解 计算 机 。 虽 然 学 生 们 不 必 是 合格 的 汇编 语言 程序 员 ， 但 他 们 一 定 要 理解 总 线 、 接 
口 、Cache 和 指令 系统 是 如 何 决定 计算 机 系统 的 性 能 的 。 


VII 


而 且 ， 理 解 计算 机 体系 结构 会 使 学 生 能 够 更 好 地 学 习 计 算 机 科学 的 其 他 领域 。 例 如 ， 指 
令 系 统 的 知识 就 能 使 学 生 更 好 地 理解 编译 器 的 运行 机 制 。 

写作 这 本 书 的 动机 源 于 我 在 提 赛 德 大 学 (University of Teesside) 讲授 计算 机 体系 结构 中 
级 课程 的 经 历 。 我 没有 按照 传统 方式 授课 ， 而 是 讲授 了 那些 能 够 最 好 地 体现 计算 机 体系 结构 
伟大 思想 的 内 容 。 在 这 门 课程 里 ， 我 讲授 了 一 些 强调 计算 机 科学 整体 概念 的 主题 ， 对 学 生 
的 操作 系统 和 C 语言 课程 均 有 不 小 的 帮助 。 这 门 课 非常 成 功 ， 特 别 是 在 激发 学 生 的 学 习 动 
力 方面 。 

任何 编写 计算 机 体系 结构 教材 的 人 必须 知道 这 门 课 会 在 3 个 不 同 的 系 讲授 : 电子 工程 
(EE)， 电 子 与 计算 机 工程 (ECE), 计算机 科学 (CS)。 这些 系 有 自己 的 文化 ， 也 会 从 各 自 的 
角度 看 待 计算 机 体系 结构 。 电 子 工程 系 和 电子 与 计算 机 工程 系 会 关注 电子 学 以 及 计算 机 的 每 
个 部 件 是 如 何 工作 的 。 面 向 这 两 个 系 的 教材 会 将 重点 放 在 门 、 接 口 、 信 号 和 计算 机 组 成 上 。 
而 计算 机 科学 系 的 学 生 大 都 没有 足够 的 电子 学 知识 背景 ， 因 此 很 难 对 那些 强调 电路 设计 的 教 
材 感 兴趣 。 实 际 上 ， 计 算 机 科学 系 更 强调 底层 的 处 理 器 体系 结构 与 高 层 的 计算 机 科学 抽象 之 
间 的 关系 。 

尽管 要 写 出 一 本 能 够 同时 满足 电子 工程 系 、 电 子 与 计算 机 工程 系 和 计算 机 科学 系 的 教材 
几乎 是 不 可 能 的 ， 但 本 书 进行 了 有 效 的 折 中 ， 它 为 电子 工程 系 和 电子 与 计算 机 工程 系 提 供 
了 足够 的 门 级 和 部 件 级 的 知识 ， 而 这 些 内 容 也 没有 高 深 到 使 计算 机 科学 系 的 学 生 望 而 却步 的 
程度 。 

本 科 计 算 机 体系 结构 课 可 在 三 个 不 同 层 次 上 讲授 : 介绍 性 的 、 中 级 的 和 高 级 的 。 有 些 学 
校 会 讲授 全 部 三 个 层次 的 内 容 ， 有 些 学 校 则 将 这 些 内 容 压缩 为 两 个 层次 ， 还 有 一 些 学 校 只 进 
行 介绍 。 本 书面 向 那些 学 习 第 一 层次 和 第 二 层次 计算 机 体系 结构 课 的 学 生 ， 以 及 那些 希望 了 
解 微 处 理 器 体系 结构 当前 进展 的 职业 工程 师 。 学 习 本 书 的 唯一 前 提 条 件 是 读者 应 了 解 高 级 语 
A (如 C) 的 基本 原理 和 基本 的 代数 知识 。 

由 于 本 书 履 盖 了 计算 机 体系 结构 的 基础 内 容 : 核心 知识 以 及 高 级 主题 ， 内 容 丰 富 ， 篇 幅 
很 大 ， 适 用 于 计算 机 体系 结构 相关 的 不 同 课程 裁剪 使 用 。 综 合 考虑 国内 高 校 计 算 机 组 成 与 结 
构 系 列 课程 的 教学 目标 和 课程 设置 ， 中 文 版 分 成 了 两 本 《计算 机 组 成 原理 》 和 《计算 机 存储 
与 外 设 》。 原 书 中 关于 门 和 数字 逻辑 、 性 能 评价 、 多 发 射 处 理 器 、 处 理 器 级 并 行 的 内 容 ， 可 
在 中 文 版 出 版 社 网 站 (http://www.hzbook.com) 下 载 。 一 一 编辑 注 


本 书 特色 


为 什么 还 要 编写 一 本 计算 机 体系 结构 教材 ? 计算 机 体系 结构 是 一 个 很 有 吸引 力 的 话题 ， 
它 会 介绍 如 何 使 用 大 量 与 非 门 那样 的 基本 元 件 搭建 一 台 计算 机 ， 也 会 介绍 如 何 用 常识 来 解决 
技术 问题 。 例 如， 提升 处 理 器 速度 的 .Cache 在 概念 上 并 不 比 信封 背面 的 记录 复杂 多 少 。 同 样 
地 ， 所 有 处 理 器 都 使 用 了 福特 所 发 明 的 汽车 制造 技术 :流水线 或 生产 线 。 作 者 努力 使 本 书 的 
内 容 更 加 有 趣 或 覆盖 更 多 的 主题 ， 例 如 本 书 将 介绍 一 些 通过 将 氧 原子 从 晶体 的 一 端 移 到 另 一 
端 来 工作 的 存储 设备 。 

用 “ 它 不 是 什么 ”来 描述 一 个 对 象 通常 比 用 “ 它 是 什么 ”来 描述 更 容易 一 些 。 本 书 并 不 
关心 微 处 理 器 系统 设计 、 接 口 和 外 设 的 工程 细节 ， 当 然 也 不 会 是 一 本 汇编 语言 的 入 门 教材 。 
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本 书 的 主题 是 微 处 理 器 体系 结构 而 不 是 微 处 理 器 系统 设计 。 就 目前 而 言 ， 计 算 机 体系 结构 被 
定义 为 机 器 语言 程序 员 所 看 到 的 计算 机 视图 。 这 就 是 说 ， 计 算 机 体系 结构 并 不 关注 计算 机 的 
实际 硬件 或 实现 ,而 仅 关 注 它 能 做 什么 a 我 们 也 不 会 考虑 微 处 理 器 的 一 些 硬件 和 接口 特征 ， 
除非 它们 对 体系 结构 有 明显 的 作用 (例如 (Cache、 存 储 管理 和 总 线 )。 


目标 体系 结构 ， 


任何 体系 结构 教材 的 作者 都 会 选 定 一 个 目标 体系 结构 ， 作 为 讲授 计算 机 设计 和 汇编 语言 
程序 设计 基础 知识 的 平台 。 教 师 们 通常 会 热烈 讨论 究竟 是 用 一 款 真 正 的 商用 处 理 器 还 是 用 一 
个 假想 的 抽象 处 理 器 来 讲授 一 门 课 。 抽 象 处 理 器 容易 理解 ， 学 习 曲 线 也 比较 浅 ， 而 且 学 生 们 
通常 会 觉得 理解 一 个 真实 处 理 器 的 细节 知识 很 不 值得 > 但 另 一 个 方面 ， 实践 工程 都 要 适应 真 
实 世界 中 的 各 种 约束 : 而且， 一 台 真 正 的 机 器 会 告诉 学 生 ， 工 程 师 们 为 了 制造 出 商用 产品 所 
必须 做 出 的 设计 选择 。 

在 20 世纪 七 从 后 年 代 ，DEC 公司 的 PDP-11 小 型 计算 机 被 广泛 地 用 作 教 学 平台 。 随 着 
摩托 罗拉 68K 等 16 位 微 处 理 器 的 出 现 ，PDP-11 逐渐 退出 了 课程 教学 。 按 照 学 术 界 的 观点 ， 
68K (大 致 以 早期 的 PDP-IL 为 基础 ) 是 一 台 理 想 的 机 器 ， 因 为 它 的 结构 相对 规整 ， 学 生 也 很 
容易 用 68K 汇编 语言 编程 。 也 许 旁观 者 会 希望 使 用 绝 大 多 数 个 人 电脑 都 使 用 的 、 随 处 可 见 
的 Intel IA32 系列 处 理 器 , 让 它 在 计算 机 体系 结构 教学 中 发 挥 重 要 作用 ,毕竟 很 多 学 生 都 有 
Intel 处 理 器 的 亲身 使 用 经 验 。 但 80x86 系列 处 理 器 从 未 在 学 术 界 真正 流行 起 来 ， 因 为 每 当 一 
款 新 处 理 嚣 发布， 其 复杂 的 结构 都 会 以 某 种 特定 方式 变化 ， 这 给 学 生 带 来 了 沉重 的 负担 。 一 
些 教 师 采用 高 性 能 RISC 处 理 咒 教学 ,比如 MIPS， 这 种 处 理 器 功能 强大 也 容易 理解 。 但 这 
种 高 端 RISC 处 理 器 多 用 于 工作 站 ;大 多 数学 生 对 其 不 甚 了解 (老师 们 观察 到 ， 由 于 熟悉 个 
人 电脑 ， 学 生 们 通常 更 需要 基于 个 人 电脑 的 技术 )。 不 过 现在 ，RISC 处 理 器 既 用 于 高 性 能 计 
算 机 ， 也 用 于 绝 大 多 数 手 机 之 中 。 

我 选择 ARM 处 理 器 作为 介绍 汇编 语言 和 计算 机 组 成 的 平台 s 这 是 一 款 性 能 高 、 结 构 优 
雅 、 易 于 学 习 的 处 理 器 。 而 且 ARM 处 理 器 有 很 多 开发 工具 ， 这 意味 着 学 生 们 可 以 写 好 ARM 
汇编 语言 源 程序 ， 并 在 实验 室 或 家 里 的 个 人 电脑 上 运行 这 些 程序 。 ; 

采用 Intel IA-64 结 构 的 Itanium 处 理 器 是 现代 教材 中 目标 体系 结构 的 二 个 有 力 候 选 。 
这 是 一 款 功能 极其 强大 但 又 极其 复杂 的 处 理 器 ,不 过 它 的 基本 结构 却 比 80x86 系列 简单 。 
Itanium 体系 结构 上 大 量 创新 性 的 特征 验证 了 计算 机 体系 结构 课程 中 的 许多 概念 一 一 从 数据 
栈 到 猜测 执行 ， 从 流水 线 到 指令 级 并 行 。 因 此 ， 本 书 将 在 高 性 能 计算 部 分 9 介绍 这 种 处 理 器 
的 一 些 特点 。 

本 书 并 不 是 一 部 传统 的 计算 机 体系 结构 教材 。 它 超出 了 传统 课程 的 范畴 ， 涵 盖 了 许多 有 
趣 、 重 要 且 相 关 的 内 容 。 作者 的 一 个 重要 目标 是 提供 适合 学 生 吸 收 的 知识 。 很 多 时 候 ， 学 生 
大 学 毕业 后 会 发 现 他 们 的 知识 体系 中 有 令 人 难堪 的 巨大 空白 。 据 我 了 解 ， 目 前 还 没有 一 本 教 
材 采 用 这 种 方法 。 例如， 所 有 计算 机 体系 结构 教材 都 会 介绍 浮 点 运算 ,但 却 很 少 会 讨论 用 于 
存储 大 量 文本 和 视频 信息 的 数据 压缩 的 代码 ， 更 不 会 介绍 MP3 数据 压缩 这 项 工业 界 的 核心 


O 这 部 分 内 容 的 电子 版 可 在 中 文 版 出 版 社 网 站 (http:/www.hzbook.com) 上 下 载 一 一 编辑 注 


技术 。 类 似 地 ;计算 机 体系 结构 教材 很 少 覆 盖 面 向 多 媒体 应 用 的 体系 结构 支撑 等 内 容 。 下 面 
列 出 了 本 教材 的 一 些 特色 内 容 。 


历史 


有 关 计 算 机 体系 结构 的 书籍 通常 会 有 一 部 分 内 容 介绍 计算 机 的 发 展 历 史 。 这 些 历 史 通 常 
是 不 精确 的 ， 并 会 受到 这 一 领域 专家 的 批评 。 不 过 ,我 认为 介绍 历史 的 章节 非常 重要 ， 因 为 
有 关 计 算 机 历史 的 知识 会 帮助 学 生理 解 计算 机 是 如 何 发 展 的 以 及 为 何 会 这 样 发 展 。 知 道 了 计 
算 机 从 哪里 来 ， 学 生 就 能 更 好 地 理解 它们 在 未 来 有 可 能 怎样 发 展 。 在 这 本 教材 里 ， 笔 者 给 出 
了 一 段 计算 发 展 的 简 史 ,而 与 本 书 英文 版 配套 的 网 络 补充 材料 中 则 给 出 了 更 多 的 历史 背景 。 


对 操作 系统 的 支持 


操作 系统 与 计算 机 体系 结构 密切 地 关联 在 一 起 。 本 书 涵盖 的 体系 结构 内 容 (例如 存储 管 
理 、 上 下 文 切换 、 保 护 机 制 等 ) 即使 是 那些 对 操作 系统 进行 研究 的 研究 者 ， 也 会 感 兴趣 。 


对 多 媒体 的 支持 


现代 计算 机 体系 结构 背后 最 重要 的 驱动 力 是 多 媒体 系统 的 发 展 及 其 对 高 性 能 和 高 带宽 的 
无 尽 需 求 。 本 书 介绍 了 如 何 面向 多 媒体 应 用 优化 现代 体系 结构 。 读 者 可 以 了 解 多 媒体 应 用 对 
计算 机 体系 结构 及 对 总 线 、 计 算 机 外 设 设 计 的 影响 ， 例 如 面向 视听 应 用 的 硬盘 。 


输入 | 输出 系统 


今天 的 计算 机 不 仅 比 它们 的 前 身 快 得 多 ,, 还 提供 了 更 多 、 更 复杂 的 将 信息 输入 计算 机 和 
从 计算 机 中 取出 的 手段 。 如 果 计 算 机 仅 与 键盘 、 调 制 解 调 器 和 打印 机 连接 ，I/O 的 重要 性 几 
乎 可 以 忽略 。 现 在 的 计算 机 经 常 与 数字 摄像 机 连接 ， 需 要 传输 大 量 数据 。 读 者 将 会 看 到 一 些 
现代 的 高 性 能 VO 系统 ,例如 USB Al FireWire 接口 ， 还 会 更 深入 地 探究 一 些 与 输入 /输出 相 
关 的 内 容 ， 如 握手 机 制 和 缓冲 机 制 。 


计算 机 存储 系统 


存储 系统 是 计算 机 世界 里 的 友 姑 娘 s 没有 高 密度 、 高 性 能 的 存储 系统 ; 就 不 会 有 价格 便 
宜 的 桌面 系统 ,更 不 会 有 32GB 存储 容量 的 数码 相机 。 本 书 将 存储 系统 分 为 两 章 : 前 一 章 介 
绍 半导体 存储 器 ， 后 一 章 介绍 磁 和 光 存 储 器 。 读 者 还 会 看 到 一 些 有 趣 的 、 正在 兴起 的 存储 技 
术 ， 如 相 变 存储 器 和 铁 电 存储 器 。 


方法 
我 之 所 以 欣赏 一 本 书 ， 是 因为 它 能 够 展现 作者 的 风格 与 观点 ;希望 本 书 也 是 如 此 。 
笔者 发 现 ， 插 图 和 文字 说 明 的 质量 是 很 多 教材 的 二 个 不 足 之 处 。 很 多 时 候 插图 几乎 没有 


注解 ， 插 图 要 表达 的 意思 根本 没有 表现 出 来 。 本 书 的 所 有 插图 都 由 我 自己 完成 ,希望 它们 能 
够 很 好 地 阐释 教材 的 内 容 。 


本 图 描述 了 一 个 含有 3 条 指令 的 代码 段 是 如 何 修改 同一 个 寄存 器 (12) 的 内 容 的 。 
这 段 代码 的 功能 是 从 两 个 寄存 器 〈r0 和 rl ) 中 各 取出 一 个 字 节 ， 将 它们 拼 在 一 起 ， 放 
人 第 3 个 寄存 器 (r2 ) 中 。 从 图 中 使 读者 能 够 很 容易 看 出 数据 是 如 何 被 处 理 的 。 


a) 寄存 器 的 初始 状态 


b) 执行 指令 ADD r2, rl, r2, 
LSL #16 后 r2 的 状态 

c) 执行 指令 ADD r2, r2, roO, 
LSL #8 后 r2 的 状态 


d) 执行 指令 MOV r2, r2, ROR 
#16 Ja r2 的 状态 





内 容 概 要 


本 书 即 为 中 文 版 《计算 机 存储 与 外 设 》 分 为 4 章 ， 重 点 关注 存储 器 、 总 线 和 输入 /输出 
等 内 容 。 

第 1 章 聚 焦 于 两 个 相关 的 话题 : Cache 和 虚拟 存储 。 尽 管 存储 系统 的 容量 在 过 去 几 十 年 
里 增加 得 很 快 ， 但 它们 的 速度 或 访问 时 间 却 并 没有 以 CPU 相同 的 速率 改进 。 这 种 情况 造成 
了 一 个 瓶颈 ， 即 存储 器 无 法 以 CPU 处 理 数 据 的 速度 来 提供 数据 。Cache 技术 已 经 发 展 到 能 用 
小 容量 快速 存储 器 完成 大 容量 快速 存储 器 的 工作 ， 在 困难 的 情况 下 已 经 尽量 做 到 了 最 好 。 笔 
者 会 介绍 Cache 是 如 何 工作 的 ， 并 描述 它们 的 原理 特征 。 第 1 章 还 将 介绍 虚 存 ， 它 将 主 存 和 
磁盘 存储 器 集成 在 一 起 。 

第 2 章 和 第 3 章 涵盖 从 静态 半导体 存储 器 到 磁盘 和 光 存 储 的 各 种 存储 技术 。 

第 4 章 进行 总 结 。 其 中 首先 介绍 将 信息 送 入 计算 机 和 从 计算 机 中 取出 信息 的 技术 ， 然 后 
描述 一 些 支 持 多 媒体 系统 的 现代 高 速 接口 。 

总 线 是 现代 计算 机 的 重要 组 成 之 一 ， 它 在 系统 的 不 同 功能 模块 之 间 传 递 信息 。 实 际 上 ， 
总 线 是 对 计算 机 性 能 至 关 重 要 的 一 个 部 件 。 读 者 将 看 到 计算 机 总 线 的 结构 、 功 能 ， 以 及 多 处 
理 絮 系统 中 允许 竞争 总 线 的 设备 访问 总 线 的 方法 。 最 后 ， 笔 者 将 介绍 世界 上 最 流行 的 高 性 能 
总 线 之 一 一 一 个 人 计算 机 中 的 PCI 总 线 。 


补充 材料 和 资源 


本 书 为 教师 和 学 生 提供 了 大 量 支持 材料 。 这 些 补充 材料 都 放 在 出 版 公司 的 网 站 上 。 要 获 
得 这 些 额 外 的 课程 材料 ， 请 访问 www.cengage.com®. E cengage.com 主页 用 页 面 顶部 的 搜索 
框 查找 本 书 ， 就 可 以 找到 访问 这 些 资源 的 产品 页 。 


O 关于 本 书 教 辅 资源 ， 用 书 教师 可 向 圣 智 学 习 出 版 公司 北京 代表 处 申请 ， 电 话 : 010-82862096/95/97， 电 子 邮 
件 : kai.yao@Cengage.com 或 asia.infochina@Cengage.com。 一 一 编辑 注 
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教师 资源 


教师 资源 包括 教师 答案 手册 (ISM)， 包 含 教材 中 所 有 图 表 的 完整 PowerPoint 幻灯 片 ， 以 
及 一 套 所 有 公式 和 例题 的 幻灯 片 。 


学 生 资源 


学 生 资 源 包 括 : 

© 一 本 详细 介绍 用 ARM 处 理 器 汇编 语言 编程 并 在 模拟 器 上 运行 这 些 程序 的 学 生 练 习 册 ; 

o 附加 学 习 材料 ， 包 括 关于 计算 机 历史 的 一 章 和 卡 诺 图 概述 ; 

o 一 些 有 用 的 链接 ， 包 括 从 ARM 公司 下 载 学 生 版 Kiel 模拟 器 的 链接 ; 

o 书 中 的 代码 ; 

o 本 书 作 者 网 站 (http://www.alanclements.org/) 上 发 布 的 所 有 幻灯 片 的 讲义 。 
致谢 

没 人 能 在 真空 中 写 出 一 部 教材 。 所 有 学 科 都 有 其 历史 、 背 景 和 文化 ， 计 算 机 体系 结构 也 
不 例外 。 一 个 作者 要 么 随波逐流 ， 要 么 沿 着 一 个 新 的 方向 写作 。 没 有 以 前 出 版 的 教材 , 例如 
当 笔者 还 是 学 生 时 用 来 研究 体系 结构 的 教材 ; 笔者 也 没有 办 法 写 出 这 本 书 。 同样 地 ,笔者 也 
必须 感谢 数 不 清 的 对 计算 机 体系 结构 知识 体系 做 出 了 贡献 的 研究 者 5 我 的 作用 是 收集 所 有 这 
些 内 容 并 为 学 生 学 习 构 建 一 条 知识 路 径 。 笔 者 必须 决定 哪些 内 容 是 重要 的 ; 哪些 是 可 以 忽略 
的 ， 哪 些 趋 势 应 该 跟随 ， 哪 些 趋势 应 被 归结 为 背景 知识 ， 等 等 。 不 过 ,笔者 还 是 要 感激 所 有 
对 知识 体系 做 出 了 贡献 的 人 

许多 人 参加 了 这 样 一 本 复杂 教材 的 出 版 工作 ， 其 中 最 突出 的 一 位 就 是 本 书 的 策划 编辑 。 
他 就 是 圣 智 学 习 (Cengage Learning) 出 版 公司 的 :Swati Meherishi, :是 他 开始 了 把 最 初 的 手 
稿 转换 为 最 终 的 优雅 文字 的 漫长 过 程 : 策划 编辑 要 有 能 力 去 了 解 书稿 以 外 的 内 容 ; 并 知道 本 
书 如 何 才 能 适应 复杂 的 市 场 。 他 对 我 有 足够 的 信心 ,. 帮 我 度 过 了 那 段 无 休止 写作 和 修改 的 时 
间 。 感 谢 swati 能 容忍 我 。 另 一 位 本 书 创作 的 关键 人 物 是 项 目 开发 编辑 Amy Hill, Amy 花费 
大 量 时 间 通 读 我 的 初稿 ， 修 改 结 构 和 内 容 组 织 方式 。 她 给 了 我 很 好 的 建议 和 温和 的 指导 。 感 
谢 圣 智 学 习 团队 全 体 人 员 的 努力 工作 和 奉献 ， 没 有 他 们 ， 这 个 项 目 还 将 停留 为 我 硬盘 上 的 一 
堆 文 件 。 还 要 感谢 Rose Kernan 和 她 RPK Editorial Services 的 团队 对 本 书 所 有 相关 任务 的 高 
效 管理 ， 以 及 Kristiina Paul 的 精心 研究 和 获得 本 书 所 有 第 三 方 材料 的 许可 。 

必须 感谢 所 有 帮助 审阅 和 修订 书稿 的 审 稿 人 及 文字 编辑 。 他 们 提出 了 很 好 的 改进 建议 ， 
并 且 在 我 错误 理解 原始 材料 时 为 我 指明 了 正确 的 方向 。 

感谢 技术 审 稿 人 和 那些 仔细 阅读 本 书 并 指出 错误 和 朴 漏 的 人 。 俄 克拉 何 马 州立 大 学 的 
Sohum Sohoni 审阅 了 全 部 书稿 的 技术 内 容 。 还 要 感谢 南 加 州 大 学 的 Shuo Qin， 他 完成 了 所 
有 的 习题 并 校正 了 教师 答案 手册 中 的 错误 。 

许多 教师 在 不 同 阶段 对 书稿 进行 了 审阅 。 感 谢 他 们 提出 的 建设 性 意见 。 下 面 是 要 感谢 的 
部 分 教师 : 

Mokhtar Aboelaze (约克 大 学 ) 

Manoj Franklin (马里 兰 大 学 — 帕克 分 校 ) 

Israel Koren (马萨诸塞 州立 大 学 安 姆 赫 斯 特 分 校 ) 
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Mikko Lipasti (威斯康辛 大 学 -麦迪 逊 分 校 ) 
Rabi Mahapatra (德州 农工 大 学 ) 

Xiannong Meng (巴克 内 尔 大 学 ) 

Prabhat Mishra (佛罗里达 大 学 ) 

William Mongan ( 德 雷 塞 尔 大 学 ) 

Vojin G. Oklobdzija (德州 大 学 - 达拉斯 分 校 ，Eric Jonsson 工程 学 院 ) 
Soner Onder (密歇根 技术 大 学 ) 

Füsun Özgüner ( 俄 净 俄 州立 大 学 ) 

Richard J. Povinelli (马凯 特大 学 ) 

Norman Ramsey (RRF) 

Bill Reid〈 克 莱 姆 森 大 学 ) 

William H. Robinson ( 范 德 堡 大 学 ) 

Carolyn J C Schauble (科罗拉多 州立 大 学 ) 
Aviral Shrivastava( 亚 利 桑 那州 立 大 学 ) 
Sohum Sohoni 俄 克拉 荷 马 州立 大 学 ) 

Nozar Tabrizi (凯特 林 大 学 ) 

Dean Tullsen 《加利福尼亚 大 学 -圣迭戈 分 校 ) 
Charles Weems (马萨诸塞 州立 大 学 ) 

Bilal Zafar ( 南 加 州 大 学 ) 

Huiyang Zhou ( 北 加 州 州立 大 学 ) 

最 后 ， 感 谢 我 的 妻子 Sue 帮 有 我 修改 书稿 。 尽 管 她 没有 技术 背景 ， 但 她 还 是 帮助 我 修改 了 


文中 一 些 英 语 使 用 有 歧义 和 难 懂 的 地 方 。 


ahs 


JERK E A L, THM RE RH. OF AB Le BE ee Bl AS B Bic SP ih 
对 学 生 学 习 有 帮助 的 附加 材料 的 建议 ， 我 会 特别 感 兴趣 。 请 将 评论 、 关 注 和 建议 发 到 


globalengineering@cengage.com。 也 可 以 通过 alanclements@ntlworld.com 直接 与 我 联系 。 


Alan Clements 


| 本 书 导 读 


Computer Organization and Architecture: Themes and Variations 


穿越 计算 机 体系 结构 之 路 


阅读 一 本 书 最 简单 的 方法 是 从 第 一 页 开始 读 ， 直 到 最 后 一 页 。 本 书 可 作为 “计算 机 存储 
与 外 设 ” 课 程 的 教材 ， 以 下 的 建议 也 许 会 帮助 读者 阅读 本 书 。 

尽管 可 以 说 本 书 中 的 所 有 内 容 都 很 重要 ， 但 它们 不 可 能 对 每 位 读者 都 同等 重要 。 一 些 读 
者 也 许 已 经 熟悉 了 基础 知识 ， 可 以 略 过 本 书 的 介绍 部 分 。 学 生 们 也 许 还 发 现 一 些 内 容 已 经 超 
出 了 课程 考试 范围 ， 不 过 这 并 不 意味 着 他 们 可 以 跳 过 这 些 内 容 。 后 面 一 些 高 级 章节 也 许 更 贴 
近 实 践 ， 或 对 学 生 今后 的 职业 生涯 更 重要 。 我 曾经 问 过 学 生 :“ 如 果 雇 主 面试 两 个 条 件 几 乎 
完全 相同 的 学 生 ， 其 中 一 个 超出 课程 范围 读 完 了 一 些 额 外 的 资料 ， 你 们 认为 哪个 学 生 更 有 可 
能 获得 这 份 工作 ?” 

这 里 将 给 出 一 些 如 何 阅读 本 书 的 建议 ， 包 括 : 

e 章节 概要 列 出 了 本 书 的 各 个 内 容 对 不 同 课程 的 适用 性 ; 

© 面向 初学 者 和 高 级 读者 的 课程 的 内 容 组 织 ; 

e 本 书 与 IEEE CS/ACM 计算 学 科 课 程 体系 的 关系 ; 

e 本 书 中 反复 出 现 的 主题 。 


=H- 
章节 概要 

下 表 列 出 了 本 书 的 各 个 章节 ， 指 明了 它们 的 内 容 是 怎样 符合 教学 计划 的 ,以 及 这 些 章节 
中 是 否 含有 可 作为 初级 或 高 级 背景 知识 的 内 容 。 


章节 高 级 读者 

RE 二 

1 Cache 存储 器 和 虚 存 pero HP Se UR? YT A Lc A 
EES EE PE ET 

2 主 存储 器 oveka aaah w Aoo 
beh ace es beg sg ase 3 ey. l 

3 二 级 存储 器 ey I See HR 

3.4 安全 存储 和 RAID 系统 ol ges 

3.5 HSA eee eee ee en ae 

3.6 Ree 《A 

3.7 光学 存储 技术 a A ae 
a ad a led, 

4 输入 /输出 ln | l g 

4.1 IO 基本 原理 EN | 

4.5 总 线 EEN iaos areas aaa 

4.6.1 本 地 化 仲裁 和 VMEbus aS hasa |, CANE LE y 

4.6.2 分 布 式 仲裁 Ee ee ha ee cb) 

4.7.1 PCL 总 线 TE st asain TY 

4.9 品行 接口 总 线 rt hg Mg rive le iain 
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适合 初学 者 和 高 级 读者 的 方法 

有 人 让 笔者 就 阅读 本 书 的 方法 给 出 一 些 建议 。 上 面 的 内 容 对 学 生 和 教师 使 用 本 书 均 有 帮 
助 。 笔 者 在 这 里 给 出 两 个 建议 ， 一 个 适用 于 初次 学 习 这 些 内 容 的 学 生 ， 另 一 个 则 适用 于 已 经 
学 习 过 数字 逻辑 或 类 似 基础 课程 的 学 生 。 但 这 仅仅 是 建议 。 每 门 课程 都 不 相同 ， 每 位 老师 也 
有 自己 的 偏好 。 下 面 两 种 方案 都 不 是 细 化 的 ， 因 为 并 非 所 列 出 的 每 个 章节 都 必须 在 课 上 讲授 。 


基础 课程 





与 IEEE CS/ACM 计算 学 科 课 程 体系 的 关系 


1991 年 ,，ACM All IEEE 计算 机 学 会 发 布 子 一 份 有 关 计 算 学 科 课 程 体系 的 报告 ,CCC1991 ) 
作为 计算 机 科学 课程 设置 的 指南 。CC1991 为 全 世界 所 有 大 学 提供 了 一 份 计算 机 科学 课程 设 
置 的 框架 。- 这 一 工作 是 基于 ACM Curriculum’68 完成 的 。 

计算 领域 没有 一 成 不 变 的 事物 ,，ACM il IEEE 计算 机 学 会 在 1998 年 开始 将 CC1991 更 
新 为 CC2001 以 涵盖 过 去 10 年 的 变化 。 我 曾 在 Willis King 博士 的 带领 下 参加 了 CC2001 标 
准 体系 结构 部 分 的 修订 。 

2007 年 ， 为 了 反映 当时 的 发 展 趋势 ; CC2001 开始 进行 内 部 修订 。2007 年 修订 版 中 引入 
了 一 些 新 内 容 ， 但 并 没有 包括 那些 全 新 的 领域 。 在 更 新 的 学 科 课 程 体系 标准 中 ， 我 主要 负责 
体系 结构 部 分 的 草稿 撰写 工作 ;然后 提交 编 委 会 审定 。 下面 列 出 了 计算 机 体系 结构 部 分 每 个 
内 容 的 学 习 目 标 。 

中 文 版 《计算 机 存储 与 外 设 》 涵 盖 存 储 系统 、 总 线 和 计算 机 外 设 的 大 部 分 内 容 。 


数字 逻辑 和 计算 机 算术 [核心 ] 


学 习 目 标 : 

o 用 基本 模块 设计 简单 电路 ; 

o 掌握 二 进 制 数 的 与 、 或 、 非 和 异 或 操作 ; 

o 理解 如 何 用 二 进 制 表示 数字 、 文 本 、 图 像 和 声音 ， 以 及 这 些 表示 的 局 限 性 ; 

© 理解 伟人 效应 是 如 何 产生 误差 的 ， 以 及 误差 传播 对 链 式 计 算 精 度 的 影响 ; 

e。- 掌 握 如 何 压缩 数据 以 减少 对 存储 容量 的 需求 ,- 包 括 无损 压缩 和 有 损 压 缩 的 概念 。 
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计算 机 体系 结构 [核心 ] 
学 习 目 标 : 
© 介绍 计算 机 从 真空 管 到 超大 规模 集成 电路 (VLSI) 的 发 展 ; 


o 理解 指令 集体 系 结构 CISA) 的 概念 ， 从 功能 和 资源 (寄存 器 和 存储 器 ) 使 用 等 方面 
描述 了 机 器 指令 的 本 质 ; 


© 理解 指令 集体 系 结构 、 微 体系 结构 、 系 统 体系 结构 的 关系 ,以 及 它们 在 计算 机 发 展 
中 的 作用 ; 


© 了 解 不 同类 型 的 指令 一 一 数据 移动 、 算 术 和 运算、 逻辑 运算 和 流程 控制 ; 

o 掌握 寄存 器 - 存储 器 型 指令 集 和 装 入 /存储 型 指令 集 的 区 别 ; 

o 掌握 如 何在 机 器 级 实现 有 条 件 操作 ; 

© 理解 子 过 程 调 用 和 返回 的 实现 方法 ; 

o 掌握 系统 在 线 可 编程 (ISP) 的 资源 不 足 对 高 级 语言 和 编译 器 设计 的 影响 ; 
© 理解 在 汇编 语言 级 如 何 将 参数 传递 给 子 程序 ， 如 何 创建 和 访问 本 地 工作 区 。 


接口 和 通信 [核心 ] 
学 习 目 标 : 
© 掌握 开 环 通信 和 闭环 通信 的 必要 ， 以 及 使 用 缓冲 来 控制 数据 流 的 方法 ; 
o 能 够 解释 如 何 通 过 中 断 实现 IO 控制 和 数据 传输 ; 


© 能 够 认识 计算 机 系统 中 不 同类 型 的 总 线 ， 理解 多 个 设备 如 何 竞争 并 获得 总 线 的 使 用 权 ; 
© 了 解 总 线 技术 的 发 展 ， 理 解 一 些 现代 总 线 (包括 串 行 和 并 行 ) 的 特点 和 性 能 。 


存储 系统 组 成 与 体系 结构 [核心 ] 
学 习 目 标 : 
© 能 够 认识 一 台 计 算 机 中 的 存储 技术 ， 了 解 存 储 技术 的 变化 方式 ; 
o 掌握 为 诸如 DVD 等 复杂 数据 存储 机 制 制定 存储 标准 的 必要 
o 理解 为 何 存储 层次 对 于 减少 有 效 存 储 延迟 是 必要 的 ; 
o 掌握 数据 总 线 上 传输 的 大 多 数 数据 都 是 填充 到 Cache; 


o 描述 Cache 的 各 种 组 织 方 式 ， 掌 握 每 种 方法 是 如 何在 开销 和 性 能 之 间 进 行 折 中 的 ; 
o 掌握 多 处 理 器 系统 中 Cache 一 致 性 的 必要 性 ; 


© 描述 虚 存 的 必要 性 ， 虚 存 与 操作 系统 的 关系 ， 将 物理 地 址 转换 为 逻辑 地 址 的 方法 。 
功能 性 组 织 结构 [ 核心 ] 

学 习 目 标 : 

e a a inal pei 

o 理解 CPU 控制 器 是 如 何 解释 机 器 指令 的 

e 掌握 如 何 使 用 流水 线 通 过 指令 重 释 执 4 ee 

o 理解 处 理 器 性 能 与 系统 性 能 之 间 的 区 别 ( 即 存储 系统 、 总 线 和 软件 对 总 体 性 能 的 影响 ); 

o 掌握 超标 量 体 系 结构 是 如 何 使 用 多 个 运算 单元 在 每 个 时 钟 周 期 内 执行 多 条 指令 的 ; 

o 理解 如 何 用 MIPS 或 SPECmarks 等 指标 衡量 计算 机 的 性 能 以 及 这 些 指标 的 局 限 ; 
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o 掌握 功 耗 与 计算 机 性 能 之 间 的 关系 ， 以 及 将 移动 应 用 功 耗 降 至 最 低 的 必要 性 
多 处 理 和 其 他 体系 结构 [核心 ] 

学 习 目 标 : 

© 讨论 并 行 处 理 的 概念 以 及 并 行 性 与 性 能 之 间 的 关系 ; 


o 掌握 用 64 位 寄存 器 并 行 处 理 多 个 多 媒体 数据 (例如 8 位 /16 位 音频 和 视频 数据 ) 以 
提高 性 能 ; 


o 理解 如 何在 单个 芯片 上 集成 多 个 处 理 器 以 提高 性 能 ; 
© 掌握 将 算法 表示 为 适合 在 并 行 多 处 理 器 上 执行 的 必要 性 ; 
o 理解 专用 图 形 处 理 器 (GPU) 是 如 何 加 速 图 形 应 用 的 性 能 的 ; 
o 理解 如 何 用 电子 设备 配置 和 重新 构建 计算 机 的 组 成 结构 。 
性 能 提升 [可 选 ] 
学 习 目 标 : 
© 解释 分 支 预测 的 概念 以 及 用 它 提高 流水 线 计 算 机 性 能 的 方法 ; 
o 理解 猜测 执行 是 如 何 提高 性 能 的 ; 
o 给 出 超标 量 体 系 结构 的 详细 描述 ;以 及 乱 序 执行 时 确保 程序 正确 性 的 必要 ; 
o 解释 猜测 执行 机 制 ， 认 识 判 断 猜测 正确 性 的 条 件 ; 
© 讨论 多 线程 技术 的 性 能 优势 ， 以 及 那些 使 这 种 技术 很 难 达到 最 大 性 能 的 限制 因素 ; 


o 掌握 VLIW 和 EPIC 体系 结构 的 基本 特点 以 及 它们 之 间 (以 及 它们 与 超标 量 处 理 器 之 
间 ) 的 区 别 ; 


o 理解 处 理 器 是 如 何 通过 重新 安排 存储 器 load 和 store 指令 的 顺序 而 提高 性 能 的 5 
网 络 和 分 布 式 系统 体系 结构 [ 可 选 ] 

学 习 目 标 : 

© 解释 网 络 系统 的 基本 组 成 ， 区 分 局 域 网 (LAN) 和 广域网 (WAN); 

e 讨论 与 分 层 网 络 协议 设计 有 关 的 体系 结构 问题 ; 

© 解释 网 络 系统 和 分 布 式 系统 在 体系 结构 止 的 不 同 ; 

e 掌握 无 线 计 算 的 特殊 需求 ; 

© 理解 物理 层 和 数据 链 路 层 角 色 上 的 不 同 ， 掌 握 数 据 链 路 层 如 何 处 理 物理 层 的 缺陷 ; 

。 描述 正在 兴起 的 以 网 络 为 中 心 的 计算 领域 ,评价 它们 当前 的 性 能 、 局 限 和 近期 的 发 

展 潜力 ; 
o 理解 网 络 层 是 如 何 检 错 和 纠 错 的 。 


外 设 [可 选 ] 
学 习 目 标 : 


e 理解 如 何 用 数字 形式 描述 压力 等 模拟 量 ， 以 及 使 用 有 限 状态 表示 是 怎样 导致 量化 误 
差 的 ; 


© 掌握 多 媒体 标准 的 必要 性 ， 能 够 用 非 技 术语 言 解释 标准 的 要 求 ; 


o 理解 为 何 多 媒体 信号 通常 需要 通过 无 损 或 有 损 编码 压缩 来 节约 带宽 ; 


© 讨论 霍 尔 器 件 、 压 力 计 等 传感器 的 设计 、 构 造 和 操作 原理 ; 
o 掌握 典型 输入 设备 是 如 何 工作 的 ; 

o 理解 不 同 显示 设备 的 工作 原理 和 性 能 ; 

© 研究 数码 相机 等 基于 高 性 能 计算 机 的 设备 的 工作 过 程 。 


新 的 计算 方向 [ 可 选 ] 


学 习 目 标 : 

。 掌握 现代 计算 的 底层 物理 基础 ; 

o 理解 物质 的 物理 特性 是 如 何 制 约 计 算 机 技术 的 ; 

。 掌握 如 何 开发 物质 的 量子 特性 以 开发 大 规模 并 行 性 ; 
o 人 掌握 如 何 用 光 完 成 特定 类 型 的 计算 ; 

© 理解 有 机 计算 机 是 如 何 挖掘 复杂 分 子 的 特性 的 ; 

o 了 解 存储 设计 的 趋势 ， 如 相 变 存储 器 和 铁 磁 存 储 器 。 


多 次 出 现 的 主题 
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本 书 的 一 些 内 容 会 多 次 出 现在 计算 机 体系 结构 或 其 他 课程 中 。 它 们 一 般 是 课程 的 基本 内 
容 ， 有 时 也 会 出 现在 计算 机 科学 的 其 他 领域 。 笔 者 力求 完整 地 列 出 儿 个 多 次 出 现 的 主题 以 及 


它们 在 本 教材 中 出 现 的 章节 。 但 这 个 列表 无 论 如 何 也 不 能 算 作 是 完整 的 。 


仲裁 4.6.1 4.6.2 4.9.2 


总 线 4.5 
Cache 存储 1.1 
存储 器 2.1 
协议 4.3 4.6.1 
状态 图 4.8 


时 序 图 2T 2.3 4.1 4.3 4.5.2 4.6.1 
虚 存 ËS 


作者 简介 | 


Computer Organization and Architecture: Themes and Variations 





Alan Clements 出 生 于 英格兰 兰 开 夏 和 郡 ， 在 苏 克 赛 斯 大 学 ( University of Sussex) 学 习 电 
子 学 。1976 年 ， 当 微 处 理 器 刚 出 现 的 时 候 ， 他 在 拉夫 堡 大 学 (Loughborough University) W 
究 数字 数据 传输 均衡 器 并 获得 博士 学 位 。 通 过 用 微 处理 器 解决 均衡 问题 ， 他 对 计算 机 设计 产 
生 了 兴趣 并 加 入 提 赛 德 大 学 (University of Teesside) 计算 机 科学 系 。 

20 世纪 70 年 代 ， 有 关 微 处 理 器 设计 实践 的 文献 非常 少 ,， 他 出 版 了 这 一 领域 的 第 一 本 书 。 
该 书 反响 非常 好 ， 他 又 撰写 了 两 本 重要 教材 《计算 机 硬件 原理 》(The Principles of Computer) 
是 一 本 本 科 生 教材 ， 全 面 地 介绍 了 计算 机 硬件 ， 其 内 容 涵 盖 了 从 布尔 代数 到 测量 转速 的 外 设 
等 各 个 方面 。 为 鼓励 学 生 对 计算 机 体系 结构 感 兴趣 ,该 书 采用 一 种 对 学 生 友好 的 风格 撰写 。 

20 世纪 80 年 代 ，Alan 撰写 了 有 关 微 处 理 器 系统 设计 的 权威 教材 ,介绍 了 设计 一 款 微 处 
理 器 的 全 部 阶段 ， 并 提供 大 量 实际 电路 ， 弥 合 了 学 术 与 实践 之 间 的 巨大 鸿沟 。 由 于 Alan 在 
微 处 理 器 设计 方面 的 贡献 ，1993 年 摩托 罗拉 授予 Alan 提 赛 德 大 学 终身 教授 。 

多 年 以 来 ，Alan 对 计算 机 体系 结构 教学 中 的 问题 越 来 越 感 兴趣 ,, 越 来 越 多 地 参与 到 计算 
机 科学 的 教育 活动 中 。2001 年 ， 他 担任 了 计算 机 学 会 国际 学 生 竞赛 主席 (CSIDC)， 并 于 同 
年 获得 英国 国家 教学 奖 ， 这 是 英国 高 等 教育 的 最 高 奖项 。 Alan 积极 参加 工程 教育 的 前 沿 会 议 ， 
并 担任 两 本 刊物 的 计算 机 科学 教育 专刊 的 客座 编辑 。 

Alan 在 IEEE 计算 机 学 会 (CS) 担任 了 多 个 职务 ,包括 CS 出 版 社 主编 , CS 第 二 副 主席 ， 
教育 活动 委员 会 主席 等 。 他 还 担任 了 伊拉克 利 翁 和 科罗拉多 州立 大 学 的 客座 教授 。 

Alan 积极 参加 学 科 课 程 体 系 设计 ， 撰 写 了 关于 未 来 计算 机 体系 结构 教育 的 论文 ， 参 加 了 
CS/ACM 2001 计算 课程 体系 项 目 。 他 为 欧盟 、 英 国政 府 、 日 立 公 司 和 和 希捷 公司 等 提供 咨询 
AEs 

2007 年 Alan 获得 IEEE 计算 机 学 会 泰勒 布 斯 (Taylor Booth) 教育 奖 。 

除了 教学 和 写作 之 外 ，Alan 还 对 摄影 感 兴趣 ， 他 的 作品 曾 数 次 公开 展 出 。 他 还 是 一 个 私 
人 飞行 员 , 将 他 对 飞行 和 摄影 的 爱好 结合 在 一 起 。 在 www.pbase.com/clements 上 可 以 找到 他 
的 摄影 作品 。 

2010 年 Alan Clements 从 全 职 教学 岗位 退休 ， 专 心 于 写作 和 拍摄 。 


出 版 者 的 话 
译 者 序 
前 言 
APSR 
作者 简介 
$18 Cache 存储 器 和 虚拟 存储 器 …… 1 
T 1, Cache TEEI ih TE «ad 4 
1.1.1. Cache 74% 349 gi HY verre eect eee 6 
1.2 Cache ERER YEBE ereere 8 
1.3 Cache 的 组 织带 11 
1.3.1 SBR BRAT achei ta 11 
13:3 REREN Cahir 15 
1:3.3 组 相 联 Caéhe i 19 
1.3.4 44483, Victim, Annex 和 
Trace Cache .pp 23 
1.4 Cache 设计 中 要 考虑 的 因素 ………… 25 
1.4.1 物理 Cache 和 逻辑 Cache ………. 25 
1.4.2 Cache 电气 特性 26 
L443 Gache 一 我 本 26 
大 27 
1.4.5 取 指 策略 pp 29 
1.4.6 多 级 Cache .pp 30 
1.4.7 ”指令 和 数据 Cache .…………… eee 32 
1.4.8 | & Cache «+++ de ea 33 
1.5 虚拟 存储 器 和 存储 器 管理 ………… 36 
1.5.1 | FMB AB Cords. nites. 36 
1.5.2 MARR ocetne 38 
本 章 小 结 ppp。 43 
习题 vs nen sy ety ee 44 
第 和 2 章 ” 宇 符 入 生 ermine 49 
2.1 简介 es 49 
2.1.1 存储 系统 的 原理 和 参数 …………… 50 


| 目录 


Computer Organization and Architecture: Themes and Variations 





2.1.2 存储 层次 54 
2.2“ 主 存储 器 55 
2.2-1--- SRAM: .da ebb sth. Ed 55 
2.2.2 KT AGH EE eee edee 63 
7 3. DRAMS Ss®Wi20-8. 37 Be. Shh. 64 
2:3.1 DRAM Biff Fp verte testers eres eee e eee 68 
2.3.2 DRAM HARARE ELLA.. 71 
2.4 ”只 读 存储 器 系列 77 
24.1 EPROM RD] CSRS 7g 
2.5 “新 兴 的 非 易 失 性 技术 本 .0 84 
25:7 RG EE E., 86 
2.5.2 MRAM 一 一 磁 阻 随机 访问 
FA BETA. ives 88 
2.$.3 ”双向 存储 器 89 
本 童 小 结 eenen 91 
习题 oo sone cceicnidves E E ET 92 
2 |) 2 96 
3.1 磁盘 驱动 器 cece cece eter centre ee eeeeen ee 97 
3.2 ”磁性 和 数据 存储 …………………………… 98 
3.2.1 3 / B 3heeerereerrrerrrererrene 100 
3.2.2 磁 记 录 密 度 的 极限 ……………… 101 
3.2.3 ”磁盘 数据 记录 原理 ……………………… 102 
3.3 ”磁盘 上 的 数据 组 织 ………………………… 109 
3.3.1 PERE For Bh RR pp 110 
3.3.2 ”磁盘 参数 和 性 能 pp 113 
3.3.3 SMART 技术 :pp 118 
3.4 ”安全 存储 和 RAID 系统 ………………… 120 
3.5 HRA e e eeeeeeererereeeeee 126 
3.6 ”磁带 130 
3.7 ”光学 存储 技术 ……………………… 132 
3.71 FPJ ereere 132 
3.7.2 从 CD 中 读 取 数据 …………… 134 


3.7.3 底层 数据 编码 pe 138 


XX 


3.7.4 “可 记录 光盘 eo 141 
R27 Si AY D TT oor natesagiOsoivaat 143 
3.7.6 蓝光， 145 
本 章 小 结 RN 146 
习题 RT le DWha/s"s Osis 9 ioe Visine e 146 
Eo a: OA tan eee 149 
4:1 VO 的 基本 原理 150 
4.1.1 外 围 设备 寄存 器 寻 址 机 制 …:…5 154 
4.1.2 外围 设 备 访问 和 总 线 宽度 ?… 字 155 
4.2 .数据 传输 ……… e eae 158 
4.2.1， 开 环 数据 传输 cm 158 
4.2.2 闭环 数据 传输 et. 159 
49. BSB E TIAE TE AE ere 160 
4.3 IOR eee 165 
4.3.1 程序 控制 Oe 166 
4.3.2. 中断 驱 动 JJO soi 167 
433 ”直接 存储 器 访问 ……………………… 174 
44 IO 系统 的 性 能 …………………………… 176 
4.5 总线 177 


4.5.1 ”总线 结 构 和 拓扑 …………… 178 
45.2 ”总 线 的 结构 179 
4.6 ”总 线 仲 裁 ……… cece eee e eee ee eee ees 185 
4.6.1 本 地 化 仲裁 和 VMEbus ……… 187 
4.6.2 分布 式 仲裁 pp 192 
4.7 PCI FI PCIe 总 线 a a a an 196 
4.7.1 PCI 总线 196 
4.7.2 -PCle 总 线 Siar Da) dy rs nd Vines eRe 203 
4.7.3 CardBus, PC 卡 和 
ExpressCard pp 207 
4.8 SCSI Al SAS 接口 210 
4.9 BFE BA ae eee 215 
ADA WR PA AS edo) hal. 216 
4.9.2 FireWire 1394 串 行 总 线 ………: 218 
4.9.3 USB ee bl i 225 
本 章 小 缚 e Da e 232 
习题 OO I he ee Ie ae ae I 232 


| 第 工 章 


Computer Organization and Architecture: Themes and Variations 


Cache FiA ae PURE IU FF fk ah 





任何 足够 先进 的 技术 都 与 魔法 无 异 。 
——Arthur C. Clark 


名 字 有 什么 关系 ? 我 们 把 玫瑰 叫 成 别 的 名 字 ， 闻 起 来 还 是 一 样 的 芬芳 。 





存储 层次 (Memory Hierarchy) 

Cache 春 储 器 (Cache Memory) 使 得 计算 机 看 似 拥 有 了 比 实际 更 多 的 快速 存储 器 。 存 储 
器 应 该 具有 非 易 失 性 (non-volatile), Her. RR, RRM. 在 现实 世界 中 , 每 种 存 
储 技术 都 有 其 自身 的 特点 ， 其 中 有 些 特点 是 相互 矛盾 的 。 例 如 ,速度 快 的 存储 器 往往 昂贵 ， 
而 速度 慢 的 存储 器 往往 便宜 。 存 储 系统 使 用 了 几 种 不 同 的 技术 ,每 种 技术 都 发 挥 着 不 同 的 作 
FA. 总而言之 , :这 些 技术 使 整个 存储 系统 表现 为 快速 、 非 易 失 性 `、 低 成 本 。 可 以 把 各 种 存储 
技术 分 为 不 同 的 层 ， 从 而 形成 存储 层次 。 

图 1-1 描述 了 典型 的 金字 塔 结构 存储 层次 。 在 顶端 的 存储 器 速度 最 快 (具有 最 短 的 访问 
时 间 )， 金 字 塔 底部 的 存储 器 速度 最 慢 。 使 用 金字 塔 来 表示 存储 层次 的 原因 是 ， 顶 层 的 存储 
器 的 容量 要 小 于 底层 的 存储 器 容量 。 


更 快 


海量 存储 器 、 互 联网 及 云 存 储 
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更 慢 


图 1-1 存储 层次 | 
片上 的 寄存 器 (register) 是 计算 机 中 最 快 的 存储 器 ， 它 保存 着 处 理 器 所 需 的 工作 数据 。 
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寄存 器 的 访问 速度 快 ， 这 使 得 load/store 寄存 器 - 寄存 器 型 体系 结构 十 分 流行 。 寄 存 器 是 以 
与 CPU 相同 的 方法 制备 的 ,与 CPU 的 时 钟 频率 相同 ， 且 与 CPU 其 他 部 分 之 间 的 数据 通路 
都 较 短 。 此 外 ， 片 上 寄存 器 可 以 直接 被 CPU 访问 ， 而 访问 其 他 的 外 部 存储 器 都 需要 一 个 过 
程 ， 包 括 存储 器 管理 、 地 址 翻译 以 及 复杂 的 数据 缓冲 和 控制 机 制 。 因 此 ， 寄 存 器 速度 很 快 。 
但 是 ，CPU 只 有 少量 寄存 器 可 以 用 来 存储 工作 数据 和 状态 信息 。 寄 存 器 不 能 存放 程序 。 

存储 器 层次 结构 中 ， 在 寄存 器 的 下 方 就 是 Cache， 更 准确 地 说 是 一 级 Cache。Cache 的 
大 小 一 般 比 主 存 小 几 个 数量 级 ， 但 真实 程序 的 性 质 和 数据 的 分 布 使 得 典型 应 用 在 95% 以 上 
的 时 间 内 只 使 用 较 小 的 指令 和 数据 集合 。 历 史上 Cache 曾经 位 于 主板 廿 ， 但 芯片 技术 的 进步 
使 得 人 们 可 以 在 处 理 器 芯片 上 实现 大 部 分 的 Cache。 

图 1-1 显示 了 两 级 Cache 存储 器 。 如 果 被 访问 的 数据 不 在 一 级 Cache 中 ， 将 访问 下 一 级 
的 存储 层次 ， 即 二 级 Cache。 并 不 是 所 有 的 系统 都 有 两 级 Cache， 有 的 系统 还 有 三 级 Cache。 

如 果 数 据 不 在 Cache 中 ， 它 必须 从 计算 机 的 主 存储 器 来 获得 ， 主 看 在 图 1-1 中 是 Cache 
的 下 一 级 存储 器 。 现 代 个 人 计算 机 和 工作 站 大 都 使 用 DRAM 来 实现 随机 访问 的 主 存储 器 。 
今天 的 个 人 计算 机 可 以 使 用 1GB ~ 48GB 的 DRAM。 

主 存 是 易 失 性 的 存储 器 ， 因 此 程序 和 数据 需要 保存 在 非 易 失 性 存储 器 中 。 最 便宜 的 存 
储 机 制 之 一 是 硬盘 ， 它 以 磁 信 号 的 形式 将 数据 保存 在 旋转 的 盘 片 上 。 一 个 硬盘 可 以 存储 超 
过 4TB 的 数据 。 然 而 ， 硬 盘 的 访问 时 间 为 Sms 左右 ， 虽 然 按 照 人 的 标准 来 说 这 已 经 很 快 了 ， 
但 还 是 比 主 存 慢 10 倍 。 今 天 ， 机 械 硬盘 被 更 快 、 更 可 靠 的 固态 硬盘 ( SSD) 代替 。 这 些 技 
术 将 在 第 3 章 中 讨论 。 





因为 主 存 通常 不 能 容纳 处 理 器 所 需 的 所 有 程序 和 数据 ， 计 算 机 采用 了 一 种 被 称 为 虚拟 存 
4 % (virtual memory) 的 存储 器 管理 系统 ， 其 中 主 存 中 仅 包 括 当 前 要 使 用 的 数据 ， 那 些 不 使 
用 的 数据 仍然 保存 在 硬盘 上 。 当 处 理 器 需要 的 数据 不 在 主 存 中 时 ， 操 作 系统 开始 介入 并 使 主 
存 和 磁盘 之 间 交 换 一 个 页 (page) 的 数据 ， 其 典型 大 小 为 4KB 一 64KB。 虚 拟 存储 器 系统 允 
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许 用 户 运行 比 主 存 大 得 多 的 程序 ， 且 不 会 导致 系统 性 能 的 显著 下 降 。 即 由 512MB 的 DRAM 
和 100GB 硬盘 构成 的 虚拟 存储 系统 的 性 能 与 具有 100GB 的 DRAM 的 存储 系统 性 能 相当 。 
虚拟 存储 器 还 提供 了 一 种 保护 数据 的 手段 。 

存储 层次 的 下 一 个 层次 是 光 存 储 ， 由 CD、DVD 或 者 蓝光 光盘 构成 。 光 盘存 储 器 将 数据 
以 凹 痕 的 方式 记录 在 塑料 盘 片 上 的 螺旋 轨迹 中 ， 并 使 用 激光 根据 凹 痕 处 是 否 有 反光 来 读 取 数 
据 。 光 盘 的 读 取 速度 比 硬盘 的 速度 要 慢 ， 这 主要 是 因为 CD 或 DVD 盘 片 的 转速 与 硬盘 片 旋 
转速 度 相 比 差 距 太 大 。 

图 1-1 中 至 少 有 一 个 数据 是 不 准确 的 : 光 存 储 器 的 速度 比 磁 记 录 存 储 器 的 速度 慢 ， 但 其 
容量 并 不 比 后 者 大 。CD 通常 可 以 容纳 650MB 的 数据 ， 而 蓝光 光盘 可 以 存储 25GB 的 数据 。 
几 年 前 ,该 容量 还 相对 较 大 ,但 硬盘 技术 的 进步 如 此 引 大 注目 ， 在 10 年 的 时 间 中 ， 硬盘 的 
容量 已 经 从 100MB 发 展 到 超过 4TB (从 10°B 增加 为 4xI02B， 即 容量 增加 了 4x 104 倍 。 
今天 的 硬盘 能 够 存储 比 光盘 更 多 的 数据 ， 在 图 1-1 中 光盘 是 因为 速度 慢 而 不 是 容量 大 才 位 于 
硬盘 的 下 一 个 层次 。 

图 1-1 中 光 存 储 器 的 下 面 为 磁带 (magnetic tape) 或 磁带 存储 器 (cartridge storage)。 这 
些 存 储 技术 通过 很 长 的 磁带 而 不 是 旋转 的 磁盘 来 记录 数据 = 磁带 可 以 容纳 大 量 的 数据 ,但 是 
它们 的 访问 时 间 在 几 分 钟 甚至 几 小 时 的 量 级 ,所 以 它们 只 能 作为 后 备 存储 器 或 者 用 于 文档 备 
份 存储 。 

磁带 的 下 一 级 是 互联 网 (Internet) 和 云 存储 (cloud storage)， 它 们 可 以 提供 远程 分 布 式 存 
储 。 数 据 存储 在 计算 机 外 部 通常 位 于 第 三 方 提供 的 虚拟 服务 器 中 ; 即 用 户 通 过 购买 存储 服 
Z, 通过 互联 网 和 WWW 来 存储 信息 a。 用 户 不 需要 知道 数据 到 底 存在 哪里 * 重要 的 是 ， 如 何 
在 灾难 降临 时 保证 数据 的 安全 性 。 此 外 ， 只 要 连接 到 因特网 ， 数 据 就 可 从 任何 地 方 访问 。 

在 第 1 章 和 第 2 章 中 深入 讨论 存储 系统 技术 之 前 ， 需 要 讨论 存储 器 是 如 何 与 计算 机 系统 
关联 的 。 如 果 访 问 CPU 内 寄存 器 的 时 间 小 于 lns， 访 问 CD 驱动 器 的 时 间 超 过 200ms， 虽 然 
完成 的 任务 都 是 数据 访问 ， 也 需要 花 大 量 的 精力 来 管理 这 种 由 多 种 不 同 存储 设备 构成 的 系统 。 

本 章 介 绍 相对 较 小 的 Cache， 与 相对 更 大 和 更 慢 的 存储 器 相 结合 ， 并 使 整个 组 合 的 系统 
看 起 来 像 一 个 又 大 又 快 的 存储 器 。 奇 妙 吧 ! 本 章 然后 介绍 虚拟 存储 器 对 地 址 的 管理 ， 这 使 得 
用 户 不 必 关 心 数据 在 存储 器 中 如 何 存储 ， 人 允许 用 户 在 不 同 的 存储 区 域 中 同时 运行 若干 程序 ， 
且 在 计算 机 需要 数据 的 时 候 自动 从 磁盘 加 载 它 。 

本 章 包 括 Cache 和 虚拟 存储 系统 ， 是 因为 它们 完成 相同 的 任务 。 两 者 都 使 用 少量 快速 
储 器 ， 将 它们 与 大 容量 的 慢 速 存 储 器 相 结合 ， 使 得 整个 存储 系统 好 似 大 容量 的 快速 存储 器 。 
两 种 技术 都 涉及 从 计算 机 地 址 映射 到 数据 在 存储 器 中 的 实际 位 置 。Cache 和 虚拟 存储 器 之 间 
的 区 别 主要 体现 在 速度 和 控制 机 制 上 。Cache 操作 需要 ns 量 级 ， 由 硬件 自动 管理 ， 而 虚拟 
存储 器 操作 需要 ms 量 级 ， 由 操作 系统 管理 。 

下 面 来 看 看 Cache 和 虚拟 存储 器 在 系统 中 的 作用 。 假 设计 算 机 执行 下 列 操作 : 


;time = time + 1 


LDR rl, = time ;rl 指向 “time”?” 
LDR r2, [r1] ; 读 time 

ADD ri1,r1,#1 ;time 加 1 

STR r2,[r1] ;# time 


这 些 指令 从 内 存 读 取 操 作 数 time. CPU 所 要 做 的 就 是 将 time 的 地 址 放 到 地 址 总 线 上 ， 
然后 读 取 数 据 ; 原理 上 ， 该 过 程 再 简单 不 过 了 。 图 1:2 展示 了 可 以 执行 此 代码 的 系统 。 计 算 
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机 给 出 的 操作 数 地 址 (此 例 中 为 time) 是 一 个 逻辑 地 址 。 将 这 个 地 址 传 给 快速 的 Cache， 在 
那里 试图 访问 数据 5 如 果 数 据 在 Cache 中 ， 就 从 Cache 中 获取 数据 。 否 则 ,如 果 数 据 在 较 慢 
的 主 存储 器 中 ， 该 数据 将 从 主 存 交 给 计算 机 和 Cache, 该 过 程 由 硬件 实现 ， 并 对 用 户 和 操作 
系统 来 说 是 不 可 见 的 。 


存储 器 主 存储 器 





图 1-2 Cache 和 虚拟 存储 器 


有 时 ， 数 据 也 不 在 主 存储 器 中 ; 它 在 硬盘 上 。 当 数据 在 磁盘 上 ， 虚 拟 存储 器 机 制 将 其 从 
磁盘 拷贝 到 主 存 储 器 。 它 当然 也 被 拷贝 到 了 Cache。 从 磁盘 传输 到 主 存储 器 的 数据 可 以 存放 
到 主 存储 器 的 任意 位 置 。 这 就 需要 存储 器 管理 单元 (memory management unit, MMU) 将 
来 自 计 算 机 的 逻辑 地 址 (logical address， 即 计算 机 认为 数据 所 在 的 地 方 ) 转换 为 物理 地 址 
(physical‘address， 即 操作 系统 把 该 数据 存放 在 存储 器 中 的 地 址 )。 虚 拟 存储 器 管理 是 操作 系 
统 完成 的 主要 任务 之 一 ， 需 要 存储 器 管理 单元 的 专用 硬件 与 操作 系统 密切 合作 。 






下 面 将 讨论 图 1-1 中 给 出 的 存储 层次 的 相关 特性 ， 然 后 介绍 Cache 是 如 何 加 快 计算 机 操 
作 的 。 本 章 的 部 分 内 容 将 介绍 影响 Cache 性 能 的 因素 ， 以 及 如 何 通 过 优化 Cache 硬件 和 应 用 
软件 来 提高 系统 速度 。 

本 章 的 后 半 部 分 关注 虚拟 存储 器 以 及 如 何 从 处 理 器 给 出 的 数据 逻辑 地 址 (或 虚拟 地 址 ) 
映射 到 存储 器 中 对 应 的 数据 物理 地 址 。 


1.1 Cache 存储 器 概述 


TES 诺 依 曼 计算 机 中 ， 存 放 程 序 和 数据 的 主 存储 器 应 该 尽 可 能 快 地 满足 CPU 的 要 求 。 
如 果 存 储 器 不 能 在 当前 周期 向 CPU 提供 所 需 访 问 的 数据 或 指令 ,存储器 必须 返回 一 个 信号 
通知 CPU 等 待 。CPU 通过 在 机 器 周期 中 插入 空闲 (idle) 或 等 待 ( wait) 指令 来 阻止 其 执行 
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一 个 操作 。 在 等 待 状态 ，CPU 将 停止 正常 操作 ， 因 此 慢 速 存储 器 将 严重 降低 其 性 能 。 在 
本 节 中 ,将 介绍 Cache 如 何 显著 提高 处 理 顺 的 性 能 ， 而 不 会 带 来 太 大 的 开销 。 图 1-3 再 次 展 
示 了 存储 器 的 层次 结构 ， 并 以 时 钟 周 期 的 形式 给 出 了 各 层 的 延迟 。 


访问 延迟 
indica 1 个 周期 
寄存 器 、 一 级 和 二 级 
访问 延迟 -- 
i 3s ape Cache 由 计算 机 管理 







处 理 器 


O 访问 延迟 3 一 10 
个 周期 


半导体 系 个 周期 由 板 级 部 分 
统 存储 器 访问 延迟 20 ~ 和 系统 管理 
| raw ai 


访问 延迟 
5 不 由 操作 系统 管理 
Mp or 10° 个 周期 
盘存 储 器 访问 延迟 


10° 个 周期 
图 1-3 存储 层次 


20 世纪 90 年 代 早 期 ， 在 各 种 期 刊 上 常常 可 以 看 到 这 样 的 评论 ,，“ 如 果 只 是 要 CPU 以 更 
快 的 速度 等 待 ， 则 制造 与 使 用 高 速 CPU 是 没有 意义 的 ”解决 该 困境 的 一 个 方案 是 使 用 更 快 
的 存储 器 以 跟 上 CPU 的 速度 。 这 听 起 来 可 能 很 容易 做 到 ， 因 为 CPU 和 存储 器 的 技术 是 相关 
的 ， 它 们 都 采用 相同 的 设计 和 制造 工艺 。 人 们 很 容易 认为 一 个 具有 5ns 周期 的 CPU 需要 存 
储 器 的 访 存 时 间 也 达到 Sns。 这 种 想当然 的 认 知 存在 两 个 缺陷 。 首 先 ， 历 史上 处 理 器 速度 的 
增长 率 已 远 远 超 过 了 DRAM 速度 的 增加 ， 这 在 过 去 的 20 年 中 已 经 是 事实 。 第 二 ，CPU 的 
机 器 周期 时 间 《〈 即 处 理 器 执行 一 个 读 或 写 操作 来 访问 外 部 存储 器 所 需 的 时 间 ) 为 Sns， 但 其 
时 钟 周期 可 能 只 有 2.Sns， 此 时 每 个 CPU 的 机 器 周期 包括 两 个 时 钟 周期 。 假 设 CPU 在 这 5ns 
的 机 器 周期 时 间 中 ， 将 花费 一 个 时 钟 周期 来 执行 管理 任务 。 处 理 器 将 需要 在 一 个 时 钟 周期 内 
获得 数据 ， 该 时 间 包 括 从 数据 地 址 可 用 到 来 自 存储 器 的 数据 被 锁定 所 需 的 时 间 。 所 以 ， 要 跟 
上 CPU 的 存储 器 访问 时 间 是 2.5ns。 因 此 ， 这 需要 存储 器 的 访问 时 间 远 低 于 其 服务 的 处 理 器 
的 机 器 周期 时 间 。 

尽管 现代 技术 确实 可 以 制造 访问 时 间 小 于 Sns 的 存储 部 件 ; 但 该 设备 的 高 昂 成 本 使 得 其 
难以 在 大 容量 存储 系统 中 应 用 。 在 20 世纪 90 年代 中 期 , 个 人 计算 机 和 工作 站 的 大 规模 生 
产 ， 为 控制 成 本 ,要 求 使 用 已 经 测试 过 的 主流 存储 部 件 (例如 ，64Mb DRAM 的 访问 时 间 为 
S0ns ) 。 

Cache 并 不 神秘 ， 它 只 是 一 个 可 由 处 理 器 快速 访问 的 高 速 存储 器 。 奇 妙 之 处 在 于 系统 只 
shire opal 某 系统 有 256KB 的 Cache 和 512MB 的 DRAM), F ARAA 
HERTE 95% 的 时 间 内 都 访问 Cache 而 不 是 DRAM。 

Cc OL 
理解 。 电 话 号 码 黄页 中 包含 成 千 上 万 的 电话 号 码 ， 但 没有 人 会 真正 带 上 一 本 。 人 们 通常 在 号 
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码 敌 中 只 记录 约 100 个 电话 号 码 。 虽 然 这 些 号 码 可 能 少 于 电话 号 码 清单 总 数 的 0.0001%， 但 
下 一 个 电话 来 自 号 码 秒 的 概率 是 很 高 的 ， 就 像 人 们 经 常会 给 朋友 打 电 话 一 样 。 

Cache 的 工作 方式 与 上 述 电 话 号 码 簿 的 工作 原理 相同 ， 它 将 经 常 访问 的 信息 放 入 Cache 
而 不 是 放 入 相对 较 慢 的 主 存储 器 。 与 号 码 憩 不同， 计算 机 不 能 提前 知道 哪些 数据 是 最 可 能 需 
要 的 。 与 人 们 将 数据 划分 为 重要 类 别 的 做 法 不 同 ， 计 算 机 的 Cache 根据 学 习 原 理 (learning 
principle) 来 操作 。Cache 通过 在 实践 中 学 习 什 么 样 的 数据 是 最 经 常 需要 使 用 的 数据 ， 然 后 
将 它们 保存 在 Cache 中 。 








Cache 名 字 的 含义 

”Cache 这 个 单词 的 发 音 为 “cash” 或 者 “ 
藏 。Cache 对 程序 员 来 说 是 不 可 见 的 ， 人 
Cache 也 称 为 ža ( ee Aa ay 





EA kit, 单词 的 含义 为 隐 


理想 情况 下 ， 由 于 基于 DRAM 的 存储 器 的 
速度 越 来 越 快 ， 对 复杂 和 昂贵 的 Cache 系统 的 
需求 应 该 消失 。 在 20 世纪 70 年代， 我 曾 阐述 
了 这 个 观点 。 时 间 证 明 我 错 了 。 图 1-4 显示 了 
在 过 去 20 年 中 存储 器 和 微 处 理 器 性 能 的 发 展 趋 
势 。 存 储 器 每 年 约 增 速 7%。 处 理 器 速度 在 这 段 
时 间 内 提升 更 快 ， 每 年 增加 55% 左右 的 性 能 。 
由 于 处 理 器 和 存储 器 之 间 的 性 能 差距 已 经 扩大 ， 
Cache 存储 系统 今天 的 作用 比 其 刚 发 明 时 的 作用 要 重要 得 多 。 

Wulf 和 McKee 讨论 了 存储 器 和 处 理 器 性 能 变化 具有 不 同 速度 带 来 的 影响 ”。 他 们 认为 
DRAM 速度 滞后 于 处 理 器 的 速度 将 最 终 被 证 明 是 限制 计算 机 性 能 的 条 件 。 他 们 认为 ， 处 理 
时 间 是 执行 内 部 操作 的 时 间 加 上 访问 外 部 存储 器 的 时 间 的 总 和 ， 因 此 ， 存 储 器 访问 时 间 部 分 
将 主 字 处 理 时 间 。 进 一 步 提 升 处 理性 能 将 毫 无 意义 。 他 们 创造 了 “ 碰 到 存储 墙 (hitting the 
memory wall)” 的 概念 ， 表 明 在 传统 微 处 理 器 系统 设计 中 存在 限制 。 

Cache 高 速 缓存 本 来 没有 什么 内 在 价值 。 总 线 用 来 分 布 数据 ; 硬盘 用 来 存储 大 量 的 数据 。 
Cache 的 作用 仅仅 是 隐藏 了 存储 器 延迟 。 如 果 存 储 需 足够 快 ， 就 可 以 不 需要 Cache. 


1.1.1 Cache 存储 器 的 结构 


Cache 存储 器 系统 的 一 般 结 构 如 图 1-5 所 示 。Cache 存储 体 与 处 理 器 的 地 址 总 线 和 数据 
总 线 相连 ， 并 与 更 大 容量 的 主 存储 器 并 行 工 作 。Cache 中 的 数据 在 主 存储 器 ( 即 DRAM) 中 
也 存在 副本 。 

访问 的 局 部 性 原理 

回 到 前 面 的 电话 号 码 短 例 子 ， 向 电话 号 码 短 中 添加 一 个 朋友 的 号 码 并 不 会 从 电话 号 码 黄页 
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1980 1990 2000 
图 1-4 存储 器 性 能 发 展 趋势 


© William Wulf and Sally McKee, "Hitting the Memory Wall: Implications of the Obvious," Computer Architecture 
News, 23(1):20-24, March 1995. 
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中 删除 他 的 号 码 。 考 虑 计算 机 访问 某 个 存储 器 位 置 。 各 个 给 定 的 存储 位 置 被 访问 的 概率 是 不 同 
的 ， 因 为 有 些 地 方 比 其 他 地 方 更 容易 被 访问 。 由 于 程序 和 其 数据 结构 的 性 质 ， 处 理 器 所 需 的 
数据 往往 在 存储 器 中 聚集 在 一 起 。 例 如 ， 堆 栈 经 常 被 访问 ， 某 些 函 数 与 其 他 函数 相 比 经 常 被 
调用 。 这 种 现象 被 称 为 访问 的 局 部 性 (locality of reference)， 这 使 Cache 的 使 用 成 为 可 能 。 


微 处 理 器 
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图 1-5 具有 Cache 存储 器 的 系统 的 结构 


一 些 地 址 被 称 为 出 现 了 空间 局 部 性 (spatial locality)， 这 是 因为 它们 聚集 在 相同 的 存储 
器 区 域内 (例如 ， 数 据 结 构 )。 程 序 员 和 编译 器 会 针对 空间 局 部 性 进行 特殊 考虑 。 假 设 某 程 
FURE P OMR, Hp PERK, R 是 由 8 个 整数 组 成 的 数组 , 0 是 另 一 个 整数 。 另外， 
假设 P 和 经 常 被 访问 而 很 少 被 访问 。 如 果 数 据 的 声明 顺序 为 P、R 和 QQ， 则 这 两 个 经 常 
访问 的 变量 在 存储 器 中 是 相 邻 的 ， 可 以 被 缓存 在 一 起 。 

一 些 地 址 被 称 为 出 现 了 时 间 局 部 性 (temporal locality)， 这 是 因为 它们 在 短 时 间 内 被 多 
次 访问 〈 例 如 ， 在 一 个 循环 体内 的 位 置 )。 某 循环 ， 例 如 : 


(for i = 0; i < 127; it+){ 
P= P + R[i]; 


} 
将 在 一 段 时 间 内 有 规律 地 访问 相同 的 变量 。 

局 部 性 原理 仅仅 是 种 指导 ， 而 不 能 成 为 定律 。 某 些 程序 同时 表现 出 时 间 局 部 性 和 空间 局 
部 性 ， 而 有 些 程序 没有 。 若 程序 要 访问 一 个 非常 大 的 矩阵 上 且 数据 分 布 是 随机 的 ， 此 时 可 能 
不 会 表现 出 空间 局 部 性 。 某 按照 地 理 位 置 列 表 的 邮购 消费 者 数据 库 可 能 具有 较 好 的 空间 局 部 
性 ， 这 是 因为 一 些 团体 由 需要 频繁 服务 的 用 户 组 成 。 一 个 简单 的 具有 时 间 局 部 性 和 空间 局 部 
性 的 例子 是 产生 内 积 的 例子 : 


dab; 

计算 机 连续 访问 ay, a), a), 2 ，…， 就 会 表现 出 空间 局 部 性 ， 因 为 这 些 连 续 的 元 素 在 
内 存 中 是 相 邻 的 。 元 素 a 和 b; 在 空间 中 存放 的 位 置 可 能 相距 很 远 ， 但 它们 从 访问 时 间 土 看 
是 相 邻 的 ， 因 为 w 和 5, 几乎 在 相同 的 时 间 被 访问 。 

Cache 使 用 Cache 控制 器 (cache controller) 来 确定 CPU 要 访问 的 操作 数 是 否 在 Cache 
中 ， 是 否 需要 从 主 存储 器 中 调 取 。 当 给 Cache 控制 器 一 个 地 址 后 ， 控 制 器 返回 一 个 信号 (hit 
或 miss) 确定 Cache 是 否 命 中 。 命 中 (hit) 表明 数据 当前 位 于 Cache H, Kat (miss) 表示 
数据 不 在 Cache 中 ， 需 要 从 主 存储 器 中 调 取 。 

现代 高 性 能 系统 具有 多 个 级 别 的 Cache : += Cache, Z% Cache 和 三 级 Cache。 一 级 
Cache 是 容量 最 小 但 速度 最 快 的 Cache。 如 果 数 据 不 在 一 级 Cache 中 ,就 在 三 级 Cache 中 查 
找 。 如 果 数 据 也 不 在 那儿 ， 则 在 三 级 Cache PAHS BR Cache HEM HB, AW EME 
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不 增加 最 快 Cache 的 容量 的 情况 下 提供 了 更 好 的 性 能 。 后 续 章 节 中 将 讨论 多 级 Cache。 


1.2 Cache 存储 器 的 性 能 


在 判断 加 入 Cache 是 否 划算 之 前 ; 需要 知道 增加 Cache 对 计算 机 性 能 会 产生 多 大 的 影 
响 。 这 里 首先 介绍 一 个 简单 的 模型 ， 忽 略 实际 Cache 系统 的 细节 : 每 个 系统 的 Cache MATE 
全 一 样 。 特 别 是 ， 该 模型 假定 每 个 Cache 项 都 为 一 个 字 宽 ， 而 实际 Cache 存放 的 是 一 个 块 
(包含 若干 个 字 )。 

Cache 系统 的 主要 参数 就 是 命中 率 (hit ratio) h， 它 定义 为 所 有 访问 操作 在 Cache 中 命 
中 的 概率 ， 由 系统 操作 统计 结果 决定 。 访 问 局 部 性 的 作用 使 得 命中 率 通常 较 高 ， 基 本 保持 在 
98% 左右 。 本 章 的 后 续 部 分 将 讨论 影响 命中 率 的 因素 以 及 使 h 保持 较 高 值 的 方法 。 

在 计算 Cache 对 处 理 器 性 能 的 影响 之 前 ， 需 要 引入 一 些 术语 : 


主 存储 器 访问 时 间 L 
Cache 访问 时 间 A 
命中 率 h 
失效 率 m 
加 速 比 S 


加 速 比 (speedup ratio) 是 没有 Cache 时 存储 系统 的 访问 时 间 与 具有 Cache 时 系统 访问 
时 间 的 比值 。 对 于 入 次 访 存 ， 如 果 没 有 Cache， 则 总 的 访问 时 间 为 Mimo 
对 于 入 次 访 存 ， 如 果 有 Cache， 总 访问 时 间 是 N htm) RAR mM, ELH m=1-h, 
因为 访问 要 么 命中 要 么 不 命中 。 因 此 ， 具 有 Cache 的 系统 的 加 速 比 为 : 
Nxt, A 
~ M(hxt,+(—Ayt,) hxt +(1- hyt, 
该 表达 式 假定 所 有 操作 均 为 访 存 操作 ， 这 是 不 正确 的 ， 因 为 处 理 器 也 要 完成 内 部 操作 。 
后 面 还 会 谈 到 这 一 点 。 如 果 不 关心 主 存 储 器 和 Cache 的 绝对 速度 的 话 ， 可 以 引入 一 个 参数 ， 
k=tJt,, EXE XT Cache 相对 主 存储 器 的 速度 比例 。 由 大 和 无 定义 的 加 速 比 为 : 
YEE PE alae abel A hi 
bk QED AD 


1-6 显示 了 当 k=0.2 时 加 速 比 S Spar PR h R 本 图 假定 k=0.2, 
系 曲线 。 正 如 大 家 理解 的 那样 ， 当 h=0 时 的 加 速 比 为 此 最 大 加 速 比 8 为 1 


1， 因 为 所 有 访 存 操 作 都 访问 了 主 存储 器 。 当 h= 时 ， 

所 有 访 存 操作 都 在 Cache 中 进行 ， 因 此 加 速 比 为 '1/k。 
从 图 1-6 中 得 出 的 一 个 最 重要 的 结论 是 ;加 速 比 : 

对 命中 率 敏感 。 RAY h 接近 90%, Cache 的 性 能 影 0 0.5 To 
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响 才 十 分 显著 ,3 该 结论 与 常识 是 一 致 的 。 如 果 产 低 命中 率 h 
F 90%, 访问 主 存储 器 的 时 间 占 较 大 比例 ,快速 访问 图 16“ 加速 比 与 命中 率 


Cache 带 来 的 效果 对 系统 性 能 的 影响 不 大 。 

上 述 加 速 比 S 的 公式 适用 于 存储 器 和 Cache 可 并 行 工 作 的 系统 ， 因 为 它 假 定 每 个 存储 周 
期 开始 时 ,同时 (并 行 ) 访问 主 存 储 器 和 Cache; 也 就 是 ， 访 存 地 址 同时 交 给 Cache MEF 
储 器 。 如 果 命 中 ;终止 对 主 存储 器 的 访问 s 如 果 Cache 不 响应 ， 数 据 将 从 主 存 储 器 中 返回 。 
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Cache 的 复杂 性 ne Ae 
包含 Cache prereset eer na 种 因 ， ae 
给 出 的 Cache HARMER Cache 










te eer E Tg 
中 外 让 en kaa calle 
4 Cache, iit A j 
“D-Cache # I-Ca Fenner earn w te 

最 后 ， 这 里 假定 简单 的 主 存储 器 系统 具有 单一 的 访问 时 间 。 RRE, maia 
成 的 现代 高 性 能 存储 系统 的 访问 时 间 相当 复杂 ， BARSESLORA HAASE, 此 
时 第 一 个 看 笠 器 访问 时 间 往往 要 比 后 续 访问 的 时 间 长 。 








实际 微 处 理 器 能 够 获得 的 加 速 比 并 不 如 上 上 述 公 式 得 到 的 那样 乐观 。 真实 微 处 理 器 的 操作 
速度 由 其 时 钟 周期 、 每 个 存储 器 访问 所 需 时 钟 周期 数 以 及 由 于 访问 存储 器 而 处 于 等 待 状态 的 
时 间 确 定 。 加 快 Cache 的 速度 并 不 如 减少 等 待 时 间 重 要 s 即使 使 用 十 分 快速 的 Cache， 也 不 
可 能 将 访 存 时 间 减 少 到 比 不 包含 等 待 状态 的 一 个 总 线 周 期 还 要 短 。 


看 看 下 面 这 个 例子 。 

微 处 理 器 的 时 钟 周期 时 间 10ns 

每 个 总 线 周 期 所 需 最 小 时 钟 周期 数 3 

存储 器 访问 时 间 40ns 

由 于 访 存 带 来 的 等 待 时 间 2 个 时 钟 周 期 
Cache 访问 时 间 10ns 

由 于 访问 Cache 带 来 的 等 待 状态 0 


这 些 数据 表明 , 存储 器 访问 需要 (3 个 时 钟 周期 + 2 个 等 待 状态 ) x 10ns=50ns， 访 问 
Cache 需要 3 x 10ns=30ns。 该 计算 过 程 并 不 包含 主 存 储 器 和 Cache 的 实际 访问 时 间 。 加 速 
比 为 : 

i: nee 
30h +50(1—h) 50—20h 


假设 平均 命中 率 为 95%， 根 据 上 式 计 算 的 加 速 比 是 1.61 (BN 161%)。 该 结果 比 直接 拿 
Cache 和 主 存储 器 的 访 存 时 间 来 计算 得 到 的 结果 (BY 2.46 ) 要 小 。 

以 上 公式 省 略 了 不 需 访问 存储 器 的 内 部 操作 的 影响 。 下 面 看 看 德 克 萨 斯 仪器 公司 操作 说 
明 书 中 给 出 的 既 考 虑 非 存储 器 访问 操作 又 考虑 访问 Cache 和 主 存储 器 中 的 数据 时 ， 微 处 理 器 
的 平均 周期 时 间 to。 

ta Lia lyt Faan loi TAN 
式 中 : 
Figg 为 处 理 内 部 操作 指令 所 占 比例 (以 70% 为 例 ); 

From 为 访 存 操 作 指令 所 占 比例 (以 30% 为 例 ); 

toye 为 处 理 器 的 时 钟 周 期 时 间 (以 10ns 为 例 ); 

twait 为 由 于 Cache 失效 导致 的 等 待 时 间 (以 50ns 为 例 ); 

tcache 为 Cache 访问 时 间 (LA Sns 为 例 ); 
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hh 为 命中 率 (以 0.9 为 例 )。 

”把 给 出 的 实际 参数 的 例子 代入 公式 计算 ,可 得 : 

ty = 70% X 10ns + 30% X [0.9 X 5ns+0.1(5ns + 50ns)] =7ns+3ns = 10.0ns 

即使 是 这 个 结果 也 没有 给 出 全 部 事实 ， 因为 实际 系统 不 会 一 次 仅 在 Cache 和 主 存储 器 间 
移动 一 个 字 的 数据 。Cache 基本 存储 单元 的 容量 不 只 是 一 个 字 ， 而 是 一 块 ( line)， 它 通常 包 
括 4 一 64 个 字 节 。 当 发 生 失 效 时 ， 从 存储 器 中 会 传输 一 块 数据 到 Cache。 因 此 ， 失 效 开销 
不 仅仅 是 调和 一 个 数据 ， 而 是 包括 一 块 数据 。 = 

此 时 ， 也 许可 以 对 前 面 提 到 的 存储 墙 进行 讨论 。 Bi ROL A 指令 平均 执 
行 时 间 Time, 为 : 

: Timeyy=CPU co * tepu + Memory uelh : boxrc+(1—A)( tenor) 
AF, CPU nse 表示 非 访 存 指令 所 占 比 例 《以 80% 为 例 ); teu 表示 这 类 指令 执行 需要 的 时 名 
周期 数 (假定 为 1); Memory,. 表示 访 存 指令 所 占 比 例 ; twemory 表示 这 类 指令 执行 需要 的 时 
钟 周期 数 (假定 为 10 )。 如 果 命 中 率 有 为 0.95， 则 : i Ret 
-| Time, = 0.80 - 1 +0.20 : 0.95 + 1 + 0.20 : (1—0.95) - 10 = 0.80 + 0.19 + 0.10 = 1.09 个 周期 

经 过 三 段 时 间 ， 处 理 器 的 速度 提高 10 FF, Cache 的 速度 提高 54, DRAM 的 速度 提高 

2 倍 。CPU、Cache 与 DRAM 的 访问 时 间 之 比 不 再 是 1: 1: 10， 而 是 1 : 2 : 50。 此 时 ， 


Time,,. = 0.80 - 1 + 0.20 - 0.95 - 2 + 0.20 - (1—0.95) - 50 = 0.80 + 0.38 + 0.50 = 1.68 个 周期 

假设 第 二 种 情况 下 ， 时钟 周期 时 间 是 第 一 种 情况 的 1/10， 加 速 比 为 10. 9N. 68=6. 488。 这 
表明 时 钟 和 CPU 的 速度 快 了 10 倍 ， 而 吞吐 量 只 增加 了 6 倍 。 

如 果 考 虑 Cache 的 写 失效 ， 可 以 重新 审视 Cache 的 性 能 。 
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整体 CPI 需要 综合 考虑 CPU 和 存储 器 ， 即 1.5+3.25=4.75 个 时 钟 周期 。 ， 
° 如 果 : (a)Cache 是 没有 失效 的 理想 Cache，(b)Cache 不 存在 ; 加 速 比分 别 是 多 pa 
(a) 具有 理想 Cache a, CPI 就 是 CPU 对 应 的 内 在 CPI, 即 i. mitt- 有 暂停 的 
时 间 /没有 暂停 的 时 间 =4.75/1.5=3.17。 O > 
(b) 如 果 不 存在 Gatne, 每 条 指令 的 平均 执行 周 期 数 为 1.5 (指令 执行 时 间 ) +100 ( 获 
取 指 令 的 时 间 )+ 0.25 x 100( 获 取 数 据 的 at 1a] = 1.5 +100 + 25 = 126.5 ARRE 此 时 ， 
加 速 比 为 4.75/126.5 = .0.038， 即 有 26 倍 的 性 能 下 降 9。 





1.3 Cache 的 组 织 


FHT Cache 的 组 织 和 结构 。 一 个 Cache 只 是 可 用 存储 空间 的 一 小 部 分 。 那 么 什么 样 
的 数据 可 以 进入 Cache ? 数据 会 放 在 什么 位 置 ? 相 比 于 主 存储 器 ，Cache 存储 系统 的 设计 以 
及 与 计算 机 系统 的 集成 都 要 更 困难 。 部 分 是 因为 Cache 速度 快 ， 部 分 是 因为 其 复杂 性 高 。 事 
SE, HB 20 世纪 80 年 代 ， 只 能 在 小 型 机 和 大 型 机 上 见 到 Cache。 直 到 20 世纪 80 
期 ， 随 着 68020/30 以 及 80386/486 微 处 理 器 的 出 现 ，Cache 才 开始 在 个 人 计算 机 中 出 现 。 今 
天 ， 已 经 可 以 将 超过 10 亿 个 晶体 管 集 成 在 芯片 中 ， 这 样 可 以 确保 所 有 高 性 能 处 理 器 都 包含 

一 个 大 容量 的 片 内 Cache。 

Cache 设计 的 根本 问题 是 如 何 构建 一 个 存储 体 来 存放 来 自 大 容量 主 存 储 器 任意 位 置 
的 一 组 数据 元 素 。 解 决 该 映射 问题 的 方法 很 多 ， 但 实际 Cache 系统 通常 使 用 组 相 联 ( set 
associative) 方式 进行 组 织 。 下 面 首先 介绍 两 个 Cache 结构 实例 ， 以 便 读者 理解 组 相 联 
Cache 的 操作 。 


实例 : WM Cache 
.下 一 章 将 会 介绍 DRAM。 然 而 ， EAM AG, 读者 只 需要 知道 从 DRAM 中 读 取 
一 组 数据 时 ， te 





a 总 时 间 为 6 6 x Sns i 1x Bast 30ns + 35ns = = eae 


1.3.1 全 相 联 映射 Cache 


在 设计 任何 一 种 存储 系统 时 需要 问 的 第 一 个 问题 是 ， 基 本 数据 单元 的 大 小 是 多 少 ? 主 存 
储 器 处 理 单位 数据 的 大 小 与 机 器 的 基本 字 长 相同 。 例如， 具有 64 位 寄存 器 的 64 位 机 器 采用 
64 位 存储 器 。 如 果 计 算 机 需要 少 于 一 个 字 的 数据 ， 它 首先 读 取 整 个 字 ， 然 后 再 忽略 它 不 想 


O 原 书 此 例 中 出 现 多 处 错误 ,已 修改 。 一 一 译 者 注 
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要 的 位 。 

虽然 计算 机 可 以 从 Cache 中 读 取 一 个 字 ， 但 该 字 的 大 小 并 不 是 Cache 基本 存储 单元 
的 大 小 。Cache 基本 存储 单元 为 包含 几 个 连续 字 的 块 (line)。 假 定 Cache 是 按照 字 的 粒度 
(granularity) 来 组 织 的 。 当 访问 某 条 指令 时 ， 如 果 它 不 在 Cache 中 ， 则 必须 从 主 存储 器 中 读 
取 。 然 而 ， 下 一 条 指令 又 有 可 能 会 失效 。 因 此 需要 比 一 个 字 大 的 Cache 基本 存储 单元 。 


Cache 行 话 的 亚 梦 
”计算 机 科学 使 用 的 术语 往往 不 一 致 ; 例如 ， 典 型 的 只 读 存储 器 (Tead only memory, - 
ROM) 同时 也 是 随机 访问 存储 器 (random access memory, RAM); #4, WT en 
程序 员 来 说 一 个 字 是 16 位 ， 而 对 于 ARM 编程 者 来 说 一 个 字 为 32 位。 S 
在 Cache 的 世界 中 ,使 用 不 同 的 术语 来 描述 给 定 地 址 对 应 的 空间 使 得 对 Cache 的 理 
解 变 得 一 AAR. Hide, Cache 存放 数据 的 基本 单元 叫 作 决 ， 有 的 英文 文献 叫 作 line， 












作者 定 we Atana a aaa yes Poepp 
了 这 些 术 语 的 含义 。 


Cache 3k (cache line) 由 一 系列 连续 的 字 构 成 ， 这 样 从 Cache 中 可 以 连续 读 出 几 条 指令 
从 而 不 会 发 生 失 效 。 当 发 生 失 效 时 ， 包 含 该 字 的 整个 Cache 块 将 从 主 存 调 人 Cache. Cache 
块 大 小 的 最 优 值 取决 于 Cache 的 总 容量 、 代 码 的 属性 以 及 采用 的 数据 结构 。 

人 们 希望 Cache 对 存放 在 其 中 的 数据 不 加 限制 ; 即 Cache 中 的 数据 可 以 来 自主 存 的 任何 
地 方 。 这 种 Cache 使 用 相 联 存储 器 把 数据 存放 在 其 中 的 任意 位 置 ， 此 时 是 根据 其 值 (value) 
而 不 是 根据 其 地 址 /位 置 (address/location ) 来 访问 数据 。 

图 1-7 说 明了 相 联 存储 器 的 概念 。 每 个 数据 项 有 两 个 值 ， 关 键 字 (key) 以 及 数据 元 素 ; 
例如 ， 最 上 面 一 行 包 含 关 键 字 52B1 和 数据 F0000。 此 时 ， 数 据 没 有 排序 ， 一 个 数据 项 可 以 
保存 在 存储 器 的 任意 位 置 。 访 问 关键 字 是 检索 数据 的 主要 手段 。 访 问 相 联 存储 器 时 需要 将 关 
键 字 输 入 存储 器 ， 然 后 将 此 关键 字 与 存储 器 中 所 有 关键 字 进 行 并 行 匹配 。 如 果 发 现 了 该 关键 
字 ， 该 数据 就 被 检索 到 了 ( 即 与 关键 字 关 联 的 数据 )。 例 如 ， 计 算 机 向 图 1-7 中 的 系统 输入 
关键 字 F001。 该 关键 字 将 同时 交 给 存储 器 中 的 所 有 位 置 进行 比较 ; H TAE FOO] SRL 
Ac (Ble? ), 存储 器 将 给 出 一 个 命中 响应 信号 ， 同 时 将 数值 42220 在 数据 端口 输出 。 

相 联 Cache 的 工作 原理 看 上 去 与 图 :1-7 中 的 机 制 相 似 ， 用 关键 字 作 为 处 理 器 访问 的 地 
址 ， 数 据 就 存放 在 该 地 址 处 。 传 统 存储 器 与 相 联 存储 器 的 区 别 在 于 ,传统 存储 器 包含 以 
0,1,2，… 编 号 连续 存储 的 元 素 ， 而 相 联 存储 器 包含 的 元 素 并 没有 排序 或 者 按 顺序 存放 。 
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了 J。 相 联 存储 器 中 的 数据 没有 
7 | 排序 ， 数 据 可 以 保存 在 存 
“| 储 器 的 任意 位 置 ， 即 没有 地 
| 址 的 概念 。 每 个 数据 根据 关 
| | 键 字 存 储 ， 并 根据 关键 字 
检索 。 该 例 中 ， 关 键 字 为 
FOOL, 检索 的 数据 为 42220。 
相 联 存储 器 中 所 有 的 关键 字 
可 以 同时 进行 并 行 比较 。 如 
果 找 到 相应 关键 字 ， 则 称 发 
生子 匹配 (或 命中 ) ， 






if 


匹配 “数据 总 线 
(命中 ) 42220 


图 1-7“ 相 联 存储 器 的 工作 原理 
下 面 详细 讨论 全 相 联 Cache 的 部 分 细节 。 图 1-8 所 示 的 相 联 存储 器 允许 Cache 中 的 任意 


一 块 都 可 以 存放 来 自主 存储 器 的 任意 一 块 数据 。 此 例 中 ,存储 器 被 划分 成 包含 两 个 字 的 块 
(每 块 两 个 字 是 为 了 简单 起 见 ， 实 际 的 Cache 可 能 每 块 含有 8 个 或 更 多 的 字 )。 


来 自 CPU 的 地 址 主 存储 器 
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块 0 
块 1 
块 2 
块 3 


Cache 存储 器 


/ 


来 自 地 址 总 线 


thn 


Cache 中 的 块 可 


-的 标志 与 Cache 有 效 位 
中 所 有 的 标志 同 能 来 自主 存储 器 


时 进行 比较 中 的 任意 一 块 
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| 1-8” 相 联 映 射 Cache 的 组 成 


相 联 Cache 的 大 小 可 以 任意 , Cache 中 抉 的 数量 与 主 存储 器 中 块 的 数量 之 间 没 有 关系 。 
考虑 主 存储 器 为 6MB， 相 联 映射 存储 器 为 64KB。 如 果 一 块 包含 4 个 32 位 的 字 ( 即 块 大 小 
为 16 字 节 )， 则 主 存储 器 由 22%16 = 1M 个 块 构成 ;而 Cache 包含 2%/16 = 4096 个 块 。 

相 联 Cache 允许 主 存储 器 的 任意 一 块 数据 存放 在 其 任意 一 块 中 。 上 例 中 ， 相 联 Cache 的 
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第 i 块 可 以 存放 来 自主 存储 器 中 1M 块 中 的 任何 一 个 。 因 此 ，Cache 中 第 i 块 需要 一 个 标志 
(tag) 来 唯一 标识 其 与 主 存储 器 中 的 某 一 块 相 关联 。 由 于 在 该 例 中 ， 主 存储 器 有 1M 块 ， 因 
此 标志 应 该 为 20 位 来 代表 2” 个 块 。 

当 处 理 器 产生 一 个 地 址 时 ， 将 使 用 块 内 地 址 来 定位 主 存储 器 或 者 Cache 中 一 个 字 的 位 置 
(上 例 中 ， 块 内 地 址 为 2 位 )。 来 自 CPU 的 20 位 的 块 地 址 A,, ~ Au 不 能 用 于 定位 Cache 中 
的 块 ， 这 是 为 什么 2: 因为 相 联 存储 器 将 主 存储 器 中 1M 个 块 中 的 任意 一 个 存放 于 其 4096 个 
块 中 的 任意 一 个 , Cache 并 不 知道 要 访问 的 块 目前 是 否 在 Cache 中 。 即 使 知道 块 在 Cache 中 ， 
也 不 知道 它 到 底 在 哪里 。 

图 1-9 说 明了 为 什么 针对 在 Cache 中 定位 一 块 这 个 问题 找 不 到 简单 的 解决 方案 。 在 该 
例 中 ， 同 样 使 用 24 位 地 址 总 线 访问 主 存 中 16MB 的 DRAM 和 块 大 小 为 64KB 的 相 联 映射 
Cache。Cache 中 每 一 块 有 16 个 字 节 ， 对 应 4 个 32 位 的 字 。CPU 可 以 访问 的 全 部 块 的 总 数 
是 2/2" = 2, 使 用 24 位 地 址 。 该 地 址 由 As 一 Aos( 块 地 址 )、Aos 一 Aos( 块 内 地 址 ) 以 及 
Au ~ Au ( 字 节 地 址 ) 组 成 。 因 此 ， 需 要 20 位 的 标志 来 唯一 标识 一 块 。 

64KB 的 Cache 有 4K 4+ 16MB 的 主 存 有 1M 

块 ， 通 过 12 位 地 址 访问 ” 个 块 ， 每 块 = 16B 

块 大 小 =16 字 节 块 大 小 =16 字 节 
: aT CT 










存储 器 空间 为 2* 字 
节 =2” 个 块 ， 每 块 16B 


块 22-1 
该 块 需要 20 位 的 
标志 来 定位 


标志 查找 表 使 用 
2” 个 标志 


找 某 块 在 4096 个 
块 组 成 的 Cache 中 
的 位 置 


图 1-9 ”使 用 标志 查找 表 的 可 行 性 


如 何 把 来 自 CPU 的 包含 1M 个 块 的 地 址 映射 为 Cache 中 包括 4096 个 块 对 应 的 地 址 ? 图 
1-9 给 出 了 一 种 解决 方案 ， 该 方案 使 用 27° 个 字 、 每 个 字 12 位 的 随机 访问 存储 器 来 存储 指向 
Cache 块 的 ,4096 个 指针 。 该 存储 器 是 稀 玖 的 ， 因 为 1M 个 存储 位 置 中 只 有 Cache 中 的 4096 
块 具有 指针 5 其 他 位 置 没有 指针 是 因为 当前 抉 在 主 存储 器 中 而 不 是 在 Cache 中 。 当 然 ,为 了 
实现 这 个 机 制 ， 需 要 在 查找 表 中 每 一 行 增加 一 个 额外 的 位 来 表示 当前 块 是 否 在 Cache 中 ( 即 
“命中 /失效 ”位 )。 
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图 1-9 所 示 系 统 实现 起 来 不 便宜 ， 因 为 需要 保存 指向 Cache 的 指针 构成 的 存储 器 容量 可 
能 与 主 存储 器 一 样 大 或 者 超过 主 存 储 器 的 容量 ! 此 外 ， 查 找 表 必须 非常 快 以 避免 增加 Cache 
的 访问 时 间 。 在 该 例 中 ，64KB 的 Cache 对 应 的 查找 表 有 IM 个 字 ， 每 个 字 12 位 〈 即 大 小 为 
1.5MB)， 故 该 方案 是 不 切实 际 的 。 可 行 的 解决 方案 是 使 用 相 联 存储 器 。 

相 联 存储 器 

相 联 Cache 名 称 来 源 于 其 使 用 相 联 存储 器 来 存放 标志 。 相 联 存 储 器 具有 nn 位 输入 但 并 不 
一 定 需 要 对 应 2" 个 唯一 内 部 位 置 。n 位 输入 交 给 相 联 存储 器 并 与 每 个 位 置 上 的 标志 域 同时 进 
行 比较 。 如 果 输 入 地 址 与 某 个 正 存 储 的 标志 相 匹 配 ， 则 输出 与 该 位 置 关联 的 数据 。 否 则 ， 相 
联 存 储 器 输出 不 匹配 。 

继续 前 面 的 例子 ， 相 联 Cache 使 用 相 联 存储 器 保存 4096 个 20 位 的 标志 ( Cache 中 的 每 
块 对 应 一 个 标志 )。 当 CPU 进行 存储 器 访问 时 ， 地 址 总 线 的 高 20 位 将 作为 相 联 存储 器 的 输 
和 人 入。 如 果 相 联 存储 器 包含 该 标志 ， 则 返回 相应 的 Cache 块 。 

由 于 来 自主 存储 器 的 块 可 位 于 相 联 Cache 中 的 任意 位 置 ， 当 Cache 满 了 会 出 现 什么 
情况 ? 需要 删除 哪个 块 来 为 新 调 人 的 块 提供 空间 ? 实际 上 ， 相 联 . Cache 会 保存 每 块 上 次 被 
访问 的 时 间 ， 这样 就 可 以 将 最 久 没 有 使 用 的 块 淘汰 (或 使 用 其 他 参数 来 决定 将 哪 一 块 淘汰 
出 Cache). Cache 的 替换 策略 与 虚拟 存储 器 使 用 的 类 似 ( 见 下 一 节 ， 例 如， 最 近 最 少 使 用 
(LRU)、 先 人 先 出 (FIFO), 或 随机 策略 等 )。 最 近 最 少 使 用 算法 直观 上 最 好 ， 因 为 它 旨 在 清 
除 最 长 时 间 没 有 被 访问 的 数据 (如果 不 使 用 它 就 丢弃 它 )。 然 而 ，LRU 算法 不 容易 实现 ， 因 
为 这 样 做 需要 记录 每 块 的 最 后 访问 时 间 。 

相 联 存储 器 很 昂贵 ， 因 为 它 需 要 大 量 的 并 行 逻 辑 将 输入 关键 字 ( 即 当前 的 地 址 ) 与 当前 
存储 的 关键 字 同 时 进行 匹配 。 市 场 上 现 有 的 相 联 存储 器 都 太 小 ， 不 能 用 来 实现 实用 的 Cache 
系统 。 

相 联 Cache 可 能 会 产生 两 种 类 型 的 失效 : 一 种 是 在 第 一 次 访问 时 的 强制 失效 ( compulsory 
miss)。 它 是 强制 的 ， 因 为 Cache 块 中 初始 时 是 没有 数据 的 。 减 少 强制 失效 的 唯一 方法 是 
在 访问 所 需 的 数据 之 前 预先 向 Cache 中 调 人 数据 。 当 相 联 Cache 已 经 满 了 ， 所 需 数据 不 在 
Cache 中 的 时 候 ， 就 会 产生 第 二 种 Cache 失效 一 一 容量 失效 (capacity miss), 


1.3.2 直接 映射 Cache 


组 织 Cache 最 简单 的 方法 就 是 采用 直接 映射 ( direct mapping)， 它 依赖 于 一 种 简单 的 算 
法 将 主 存储 器 中 的 数据 块 映 射 到 Cache 中 的 块 。 在 直接 映射 Cache 中 ， 主 存 块 被 分 为 若干 
个 组 (set)， 组 的 大 小 与 Cache 的 大 小 一 致 。 如 前 面 的 例子 ,一 台 具 有 16MB 内 存 和 64KB 
Cache 的 计算 机 会 将 存储 空间 分 为 16MB/64KB = 256 个 组 。 
| 为 说 明 直 接 映 射 Cache 是 如 何 工作 的 ， 假 定 主 存储 器 包括 32 个 字 ， 需 要 5 位 的 地 址 来 

W, Cache 的 大 小 为 8 个 字 ， 块 大 小 为 2 个 字 。 根 据 前 面 的 定义 ， 组 大 小 为 : 存储 器 容量 

/Cache 容量 = 32/8 = 4。 给 定 5 位 地 址 son sh. Mw, HPs 位 定义 了 组 , 1 位 定义 了 块 ， 
w 位 定义 了 字 。 图 1-10 展示 处 理 器 当前 需要 的 字 是 如 何 根 据 组 地 址 、 块 地 址 以 及 字 地 址 进 
行 访问 的 。 为 了 方便 讨论 ， 这 里 只 考虑 组 和 块 的 访问 ， 而 不 管 一 块 中 有 多 少 个 字 。 

图 1-10 所 示 的 组 织 形式 被 称 为 直接 映射 Cache， 因 为 Cache 中 某 块 的 位 置 与 主 存储 器 
中 块 的 位 置 之 间 有 直接 的 关系 。 在 图 1-10 给 出 的 例子 中 ，Cache 具有 2 位 的 块 地 址 ， 因 此 
具有 2 =4 个 块 。 如 果 直 接 映射 Cache 有 5 位 块 地 址 字段 ， 则 Cache 就 有 2 个 数据 块 。 
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KA CPU AY 5 位 地 址 









块 地 址 在 每 组 
中 选择 相同 的 块 
(图 中 为 第 2 块 ) 


Cache 存储 器 


Cache 中 的 
一 块 可 以 来 自 
主 存 中 4 个 组 
中 的 任意 二 个 


图 1-10 使 用 5 位 地 址 访问 Cache 和 主 存储 器 
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当 处 理 器 产生 一 个 地 址 ， 就 会 访问 Cache 中 对 应 的 块 。 例 如 ， 如 果 处 理 器 生成 5 位 地 址 
01100， 则 访问 第 2 块 。 图 1-10 显示 了 主 存储 器 中 有 4 个 块 编号 为 第 2 块 : 第 0 组 的 第 2 块 、 
第 1 组 的 第 2 块 、 第 2 组 的 第 2 块 以 及 第 3 组 的 第 2 块 。 假 设 在 这 个 例子 中 ， 处 理 器 访问 第 
1 组 中 的 第 2 块 ， 显 然 的 问题 是 : 系统 如 何 知 道 Cache 中 被 访问 的 第 2 块 是 来 自主 存储 器 中 
第 1 组 的 第 2 块 ? 

图 1-11 显示 了 直接 映射 Cache 是 如 何 解 决 这 个 问题 的 。 在 Cache 中 每 块 都 有 一 个 标志 
来 标识 该 块 来 自主 存储 器 中 的 哪个 组 。 当 处 理 器 给 出 的 访问 地 址 中 块 地 址 为 3，Cache 中 第 
3 块 对 应 的 标志 将 发 送 给 比较 器 。 同 时 ， 处 理 器 地 址 中 的 组 字段 也 被 发 送 给 比较 器 。 如 果 它 
们 相同 ， 则 表明 Cache 中 的 块 就 是 所 需要 的 块 ， 发 生命 中 。 如 果 它 们 不 相同 ， 则 发 生 失 效 ， 
对 应 Cache 块 中 的 数据 必须 更 新 。 

当 访 问 第 i 块 并 发 生 失 效 时 ，Cache 中 原来 的 第 i 块 要 么 被 丢弃 ， 要 人 么 被 写 回 主 存储 器 ， 
这 取决 于 主 存储 器 的 更 新 是 如 何 组 织 实现 的 。 后 文 将 对 Cache 这 方面 的 问题 进行 研究 。 

图 1-12 从 另 一 种 观点 来 描述 直接 映射 Cache， 其 中 主 存储 器 被 当成 一 个 组 数 x 块 数 的 
和 矩阵， 该 例 中 为 4 块 x4 组 。 和 矩阵 的 旁边 是 Cache， 它 具有 与 主 存储 器 相同 的 块 数 。 当 前 
Cache 中 的 块 与 主 存储 器 中 阴影 部 分 的 块 相 对 应 。 图 1-12 表明 ，Cache 中 的 块 是 如 何 从 组 号 
相同 的 主 存储 器 的 某 组 中 获得 的 。 AA 

图 1-13 给 出 了 直接 映射 Cache 存储 器 系统 的 框架 结构 。Cache 存储 体 由 保存 数据 的 高 速 
RAM 构成 。Cache 标志 RAM (cache tag RAM) 是 一 种 由 高 速 随机 访问 存储 器 和 数据 比较 器 
构成 的 特殊 设备 。Cache 标志 存储 器 的 地 址 输入 是 处 理 器 访问 的 块 地 址 (line address)， 该 地 
址 用 来 访问 或 指向 包含 该 组 标志 的 标志 RAM 中 的 位 置 。 将 该 地 址 对 应 Cache 标志 RAM 中 
的 数据 送 往 比较 器 并 与 地 址 总 线 上 的 组 地 址 进行 比较 。 如 果 处 理 器 给 出 的 组 字段 与 被 访问 块 
的 标志 相 匹 配 ，Cache 标志 RAM 返回 命中 信和 号 。 
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SKA CPU 的 5 位 地 址 







组 地 址 用 
来 与 当前 
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块 地 址 在 Cache 
中 选择 一 个 块 










Cache 存储 
器 中 的 数据 
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第 0 组 第 1 组 第 2 组 第 3 组 
图 1-12 ”直接 映射 Cache 的 另 一 个 视角 


直接 映射 Cache 不 需要 复杂 的 块 蔡 换 算法 。 如 果 需 要 访问 组 y 中 的 块 x 且 发 生 了 失效 ， 
主 存 储 器 组 y 中 的 块 x 将 被 加 载 到 Cache 中 的 第 x 块 。 当 新 块 载 和 时， 直接 将 失效 位 置 对 应 
的 块 淘汰 出 Cache。 

直接 映射 Cache 的 优点 是 其 固有 的 并 行 性 。 由 于 保存 数据 的 Cache 存储 器 和 Cache 标 
志 RAM 是 独立 的 ， 它 们 可 以 被 同时 访问 。 一旦 从 地 址 总 线 给 出 的 标志 字段 与 Cache 标志 
RAM 的 标志 字段 相 匹 配 ， 则 命中 ， 从 -Cache 中 获取 的 数据 就 是 有 效 的 。 ) 

直接 映射 Cache 的 缺点 是 它 对 被 缓存 数据 的 位 置 敏 感 。 可 以 联系 地 址 籍 来 理解 ， 假 设 为 
每 个 字母 保留 6 人 外 位置。 如 果 你 已 经 有 6 个 朋友 的 姓 是 以 8 开头 的 ; 那么 下 一 次 再 碰 到 一 个 
人 的 姓 是 以 开 头 时 就 会 出 现 问题 。 这 很 烦人 ， 因 为 给 和 式 预 留 的 位 置 可 能 完全 是 空 的 
而 不 能 用 ; 由 于 只 有 一 个 编号 为 x 的 块 能 够 放 在 Cache 中 ， 访 问 主 存储 器 中 其 他 不 同 的 组 中 
块 号 为 x 的 块 将 导致 Cache PH x 块 被 替换 。 l 

即使 Cache 没有 存 满 ， 在 访问 主 存储 器 不 同 组 中 相同 块 号 的 两 个 块 时 ， 会 导致 块 在 
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Cache 和 主 存储 器 间 进 行 交 换 。 该 问题 会 导致 较 低 的 Cache 利用 率 和 高 失效 率 。 这 种 在 即使 
Cache 没有 存 满 时 也 发 生 块 替换 的 情况 称 为 冲突 失效 (conflict miss)， 这 是 由 于 新 块 和 原 组 
存 块 之 间 存 在 冲突 。 读 者 很 快 会 看 到 ， 提 高 直接 映射 Cache 的 性 能 并 不 难 。 


iy 








Cache 标志 -一 一 
存储 器 


地 址 





/ \ 


与 被 访问 的 TEE 定义 了 当前 块 ” 当 前。 从 当前 块 中 
块 相关 的 标志 ~ 属于 哪个 组 ” 块 地 址 选择 一 个 字 


将 标志 与 当前 组 “一 
地 址 进行 比较 
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图 1-13 ”直接 映射 Cache 的 结构 


虽然 在 数据 组 织 不 恰当 时 ， 直 接 映射 Cache 的 性 能 会 非常 差 ， 但 实际 程序 的 统计 测量 结 
果 表明 ， 直 接 映射 Cache 在 最 坏 情况 下 的 性 能 对 其 平均 性 能 的 影响 并 不 明显 。 

图 1-14 展示 了 一 个 非常 简单 的 直接 映射 Cache 的 操作 ， 该 系统 具有 16 个 字 的 主 存储 器 
和 8 个 字 的 直接 映射 Cache。 为 简化 讨论 ， 只 考虑 对 指令 的 访问 。 该 Cache 可 以 保存 来 自 两 
个 组 的 一 个 块 。 图 中 在 Cache 左 侧 将 块 编号 为 0 一 7， 在 其 右 侧 编导 8 ~ 15， 用 来 表明 主 存 
储 器 中 8 ~ 15 块 被 缓存 。 假 定 块 大 小 与 字 的 长 度 相等 ， 并 运行 如 下 代码 ; 


LDR ri, [r3] ; 从 存储 器 中 载 入 ri， 地 址 由 3 指示 
LDR 42, [r4] ; 从 存储 器 中 载 入 zx2， 地 址 由 工 4 指示 
BL Adder ; 调用 子 程序 
B XYZ ; 

Adder ADD r1,r2,r1 ; rl 加 工 2 RHA v1 - 
MOV pe,lr ; 返回 





Cache 7-18 & Po E Rhi EB 19 


Cache 


Cache Memory Cache 


0 
$ 
2 
3 
4 
5 
6 
7 





YAU RWNHHO 





a) 初始 时 Cache 是 空 的 
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d) 获取 中 BL Adder 的 指令 e) 获取 ADD rl,r2,rl 指令 并 替换 f) 获取 返回 指令 MOV pcr 


BLAdder 指令 
Memory Cache 


Cache 块 的 来 源 有 两 个 : 每 组 中 一 个 。 左 边 的 数字 ， 
0,1,2,7 对 应 于 第 0 组 ， 右 边 的 数字 8,9,…,15 对 应 于 第 1 
|. ZAF, BL Adder 指令 位 于 第 0 组 的 第 2 块 ， 然后 被 位 


| 于 第 1 组 第 2 块 的 ADD r1,r2,r1 指令 替换 ， 因 为 它们 具有 
| 相同 的 Cache 块 地 址 。 





是 获取 BXYZ 指 令 并 替换 MOV 
pclr 指令 
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图 1-14 运行 程序 时 直接 映射 Cache 的 快照 


图 1-14 只 显示 了 取 指 周期 。 图 1-14a 给 出 了 系统 的 初始 状态 。 图 1-14b ~ d 显示 取 前 3 
条 指令 ， 每 条 都 存放 在 连续 的 Cache 位 置 。 当 图 1-14d 中 调用 子 程序 后 ， 转 向 地 址 为 10 的 
指令 。 在 该 直接 映射 Cache 中 ， 块 10 和 块 2 将 映射 到 相同 的 Cache 块 。 之 后 ， 在 图 1-14e 
H, ADD 覆盖 了 Cache 块 2 中 的 BL 指令 此 时 发 生 了 冲突 失效 ， 由 于 目的 位 置 已 经 被 占用 ， 
数据 不 能 调 人 Cache， 除 非 该 位 置 被 空 出 来 。 

图 1-14f 中 ,第 11 块 中 的 Mov pc, 1r 指令 被 装 人 Cache 中 第 3 块 。 最 后 ， 在 图 1-14g 
中 ,程序 返回 ,第 3 块 中 的 指令 B xyz 被 装 入 Cache 中 的 第 IR, BRU ATH. 

图 1-14 表明 ， 即 使 在 一 个 简单 的 系统 中 ， 直 接 映 射 Cache 中 的 元 素 可 以 很 容易 地 被 蔡 
换 。 如 果 上 述 这 段 代 码 循环 执行 ， 频 繁 蔡 换 Cache 中 的 数据 将 降低 性 能 。 


1.3.3 “组 相 联 Cache 


上 一 节 介 绍 的 直接 映射 Cache 很 容易 实现 ， 不 需要 块 替 换算 法 。 然 而 ， 它 不 允许 来 自 不 
同 组 但 具有 相同 块 号 的 块 被 同时 缓存 。 全 相 联 Cache 对 块 存放 的 位 置 没 有 限制 ， 但 它 需 要 考 
虑 一 旦 Cache 已 满 将 替换 哪个 块 。 此 外 ， 容 量 大 的 全 相 联 Cache 实现 起 来 十 分 昂贵 。 组 相 联 
(set-associative) Cache 结合 了 上 述 两 种 Cache 的 优点 ， 实 现 起 来 代价 也 不 高 。 因 此 ， 它 是 计 
算 机 上 常见 的 Cache 组 织 形 式 。 
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作 ， 就 可 以 使 块 i 进 入 它们 中 的 任意 一 个 。 如 果 使 用 nn 个 直接 映射 Cache 并 行 工 作 ， 就 可 以 
使 块 i 进 入 个 位 置 中 的 任意 一 个 。 这 就 是 n 路 组 相 联 Cache. 

TE n 路 组 相 联 Cache 中 ， 给 定 块 可 载 人 Cache 中 元 个 可 能 的 位 置 。 通 常情 况 下 , n 的 范 
围 是 2 一 8。 图 1-15 展示 了 一 个 四 路 组 相 联 Cache 的 结构 ， 它 由 4 个 并 行 操作 的 直接 映射 
Cache 构成 。 在 此 情况 下 , 块 i 可 以 载 人 4 个 直接 映射 Cache 中 的 任意 一 个 。 因 此 ， 具 有 相 
同 块 号 的 不 同 块 在 调和 人 Cache 时 产生 的 冲突 将 大 大 减少 。 这 种 方式 称 为 相 联 (associative )， 
因为 来 自 处 理 器 的 块 地 址 被 并 行 送 给 每 个 直接 映射 Cache。 然 而 ， 一 般 并 不 会 对 成 千 上 万 的 
存储 单元 同时 进行 搜索 ， 而 只 对 2 一 8 个 直接 映射 Cache 进行 并 行 访问 。 每 个 Cache 的 比较 
结果 ( 即 命 中 ) 将 被 交 给 或 门 ， 其 输出 结果 表示 是 否 有 一 个 Cache 命中 。 


地 址 





每 个 Cache 都 是 一 
个 直接 映射 Cache 


如 果 4 个 Cache 的 任 AA 
意 一 个 命中 则 输出 命中 
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合成 一 个 命中 
图 1-15 “组 相 联 Cache 的 组 成 


图 1-16 使 用 组 相 联 Cache 重复 了 图 1-14 中 给 出 的 例子 。 两 个 例子 基本 相同 ， 只 是 组 相 
Ek Cache 中 的 每 个 直接 映射 Cache RA 43k, 但 总 容量 还 是 8 块 。 图 1-16 中 所 示 为 一 个 二 
路 组 相 联 Cache， 块 可 以 保存 在 上 面 或 者 下 面 的 直接 映射 Cache 中 的 任意 一 个 。 

图 1-16 中 前 几 步 是 一 样 的 ， 直 到 图 1-16e， 当 地 址 为 10 的 app r1,r2,r1 指令 映射 到 第 2 
块 (组 大 小 为 4) 时 ,该 块 已 经 被 BL adder 指令 占用 。 在 相 联 的 第 2 个 Cache 的 相应 位 置 是 
空闲 的 ， 因 此 该 指令 可 以 缓存 在 下 面 的 Cache 的 第 2 块 ， 而 不 必 替 换 上 面 Cache 中 的 块 。 图 
1-16f, Mov pc,lr 指令 的 块 号 为 3， 保 存在 上 面 的 Cache 中 。 然 而 ， 当 执行 主 存储 器 第 3 块 中 
的 B xyz 指令 时 ， 上 面 的 Cache 的 第 3 块 已 被 占用 ， 故 它 被 缓存 在 下 面 Cache 的 第 3 块 中 。 
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d) 获取 BL 到 Adder 的 指令 e) 获取 ADD zl,z2,zl 指 令 ， 
由 于 上 面 的 Cache 的 第 2 块 被 占 缓存 在 上 面 Cache 的 第 3 块 
用 ， 因 此 使 用 下 面 的 Cache 的 第 

2 块 
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g) RMB xyz 指令 并 缓存 。 由 于 不 能 够 存 
放 在 上 面 Cache 的 第 3 块 ， 故 存放 在 下 面 
Cache 的 第 3 块 
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1-16 ”组 相 联 Cache 的 行为 
来 自 IDT 应 用 笔记 AN-07《 Cache 标志 RAM 芯片 简化 Cache 存储 器 设计 》 的 表 1-1 展 
示 了 Cache 的 组 织 形 式 对 失效 率 的 影响 。 该 失效 率 已 经 与 直接 映射 Cache 的 失效 率 相 除 进行 
了 归 一 化 ， 用 来 表示 相对 于 直接 映射 Cache 的 结果 。 四 路 组 相 联 Cache 的 结果 要 比 直接 映射 
Cache 的 结果 好 30%。 进 一 步 增加 相 联 度 对 于 性 能 的 改善 有 限 。 
表 1-1 Cache 的 组 成 对 失效 率 的 影响 





Cache 组 成 归 一 化 的 失效 率 
直接 映射 1.0 
二 路 组 相 联 0.78 
四 路 组 相 联 0.70 
八路 组 相 联 0.67 
全 相 联 0.66 





IEA Freescale 半导体 公司 应 用 笔记 的 图 1-17 展示 了 不 同 容量 的 Cache、 使 用 GCC 编译 
器 时 相 联 度 和 命中 率 之 间 的 关系 。 可 以 看 出 ,Cache 容量 比较 小 时 ， 相 联 度 是 一 个 重要 因子 。 
当 Cache 容量 达到 256KB 时 ， 相 联 度 的 作用 就 不 十 分 显著 了 。 
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图 1-17 ”组 相 联 度 和 Cache 容量 


失效 的 种 类 
J Ciche 和 ANAL ab 2, 因为 命中 率 高 使得 C Cache 是 
有 效 。 在 设计 或 改善 Cache 系统 时 ， 人 们 会 对 失效 率 而 不 是 命中 府 感 兴趣 ， 因 为 命中 只 
有 一 种 可 能 (数据 在 Cache 中 )， 而 失效 却 有 很 多 原因 。 可 以 通过 不 ‘atte as 
失效 的 数据 不 在 Cache 中 ”来 提高 Cache 的 性 能 。 
Cache 的 失效 可 以 分 为 3 类 : 强制 (compulsory) AR, SE Goce katte 
X (conflict) 失效 。 强 制 失效 指 的 是 第 一 次 访问 数据 块 时 ， 它 一 定 不 在 Cache 中 ， 这 是 
无 法 避免 的 。 有 些 处 理 器 通过 预测 来 避免 强制 失效 ， 在 需要 的 数据 被 访问 之 前 将 其 纳入 
Cache。 当 最 终 访问 数据 时 ， IRE CEE. Cache ae pro Se 
失效 。 这 是 预 取 机 制 的 一 种 形式 。 mana 
第 二 种 失效 为 容量 失效 。 在 这 种 情况 下 ， RRR WELK ( 即 当前 程序 所 
使 用 的 块 ) 比 Cache 容量 要 大 ， ent Cache T Serde 





EROE 冲突 失效 占 全 部 失效 的 比例 为 20% ~ 40%, BAR 
Cache t 的 冲 突 失效 最 小 ， 因为 数据 块 可 以 被 存放 在 Cache 中 的 HERE. 
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Cache 被 认为 是 重要 的 = 

下 面 的 照片 是 Intel Core i7 的 裸 片 。 该 处 理 器 由 4 个 独立 的 处 理 单元 构成 。 照片 底 
部 用 长 方形 框 出 的 是 4 个 处 理 单元 共享 的 三 级 Cache。 展 示 这 张 照片 是 为 了 说 明 芝 片 抽 
RANA Cache 是 处 理 器 非常 重要 的 组 成 部 分 。 了 照 片 中 用 于 Cache 的 区 片面 积 要 大 子音 
个 处 理 单元 的 和 片面 积 。 





1.3.4 HR, Victim, Annex 和 Trace Cache 


由 于 Cache 非常 重要 ， 针 对 它 的 改进 已 经 进行 了 大 量 的 研究 ， 特 别 是 针对 异常 行为 的 处 
H (例如; 当 数 据 被 缓存 :替换 并 再 次 被 缓存 ， 等 等 )。 

在 直接 映射 Cache 基础 上 进行 变更 可 以 得 到 伪 相 联 (pseudo-associative) Cache。 当 直接 映 
射 Cache 发 生 冲 突 失 效 时 ， 为 失效 的 块 提供 一 个 后 备 位 置 (alternative accommodation). FT 
文本 框 中 的 “ 流 缓冲 和 条 缓冲 ”部 分 对 冲突 失效 和 其 他 类 型 失效 的 自然 属性 进行 了 进一步 的 
讨论 。 当 直接 映射 Cache 发 生 失 效 时 ， 伪 相 联 Cache 根据 旧 的 地 址 再 计算 一 个 新 的 地 址 来 存 
放 数 据 。 通 常情 况 下 ， 新 的 地 址 是 对 当前 地 址 高 端的 一 位 或 几 位 进行 取 反 操作 得 到 。 虽 然 这 
是 规避 直接 映射 Cache 限制 一 种 巧妙 方法 ,但 它 需 要 在 一 次 失效 以 后 进行 第 二 次 Cache 访问 。 

Victim Cache 是 一 个 小 的 Cache, 用 来 保存 最 近 被 蔡 换 出 Cache 的 项 目 ( 即 遇难 者 
(victim))。Victim Cache 与 原 Cache 并 行 访问 ,理想 情况 下 ， 它 是 全 相 联 的 。 因为 它 的 容量 
非常 小 可 以 同时 搜索 的 块 数 有 限 ， 因 此 可 以 使 用 全 相 联 的 方式 构建 。 

一 个 小 的 Victim Cache 可 以 减少 直接 映射 Cache 的 冲突 失效 ， 这 是 因为 它 保存 的 被 替换 
块 的 块 号 与 刚 调 入 块 的 块 号 相同 -Victim Cache 也 可 以 在 主 Cache 被 充满 ”开始 出 现 容量 失 
效 的 时 候 使 用 。Victim Cache 保存 了 被 替换 出 Cache 的 块 ， 由 于 数据 既 没 有 在 主 Cache 也 没 
有 在 Victim Cache 中 复制 ， 因 此 并 没有 浪费 空间 。 

Victim Cache 典型 应 用 的 例子 是 嵌 套 循环 。 考 虑 在 一 个 循环 内 调用 了 一 段 程序 ， 循 环 的 


©. Norman P. Jouppi, “Improving Direct-Mapped Cache Performance by the Addition of a Small Fully-Associative 
Cache and Prefetch Buffers”, WRL Technical Note TN-14, Digital Western Research Laboratory. 
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起 点 与 被 调用 程序 间 有 一 定 的 距离 。 循 环 开始 后 ， 程 序 被 调用 。Cache 被 充满 了 ， 就 必须 替 
换 一 些 块 为 新 的 指令 提供 空间 。 当 程序 执行 完 返 回 循环 时 ，Cache 又 需要 替换 一 些 块 ， 依 此 
类 推 。Victim Cache 可 以 保存 被 蔡 换 的 指令 并 确保 它们 在 循环 和 函数 调用 序列 被 执行 时 命中 。 
Jouppi 针对 Victim Cache 的 研究 表明 ， 它 可 以 很 小 ,但 十 分 有 效 。 一 些 基准 测试 表明 ， 当 使 
用 容量 少 到 4 项 的 Victim Cache 时 ， 可 以 减少 80% 的 冲突 失效 。Jouppi 在 研究 使 用 Victim 
Cache 来 减少 总 的 失效 时 ， 发 现 不 同 的 基准 测试 程序 的 结果 差异 很 大 。 使 用 容量 为 4 项 的 
Victim Cache 时 ， 各 种 基准 测试 程序 平均 会 使 失效 率 降低 15%, 和 

最 多 会 降低 70%。 








对 Victim Cache 的 修改 是 使 用 选择 性 ( selective) Victim Cache, Victim Cache 中 的 项 可 
能 来 自 Cache 中 被 替换 的 块 或 者 主 存储 器 。 当 新 的 块 被 预 取 时 ,采用 一 种 预测 算法 来 确定 
它 是 否 应 该 被 载 人 Cache 或 是 Victim Cache。 预 测 的 目的 是 为 了 尽量 避免 Cache 污染 ， 即 避 
pears bea 预测 机 制 要 求 记 录 每 块 的 历史 状态 信息 。 该 机 制 使 用 了 两 位 指示 

: 一 位 用 来 表示 位 于 Cache 中 的 块 从 来 没有 被 访问 过 ， 男 一 位 表示 惯性 (inertia) 以 避免 
Cache 和 Victim Cache 间 进 行 过 度 的 交换 。 

另 一 个 由 John 和 Subramanian 提 出 的 特殊 Cache X Annex Cache. ne Victim Cache — 
FE, Annex 是 一 个 专用 的 Cache， 但 位 于 一 级 Cache 的 前 面 。 即 Victim Cache 位 于 Cache 
的 出 口 ， mi Annex Cache 位 于 入 口 。 Victim Cache 给 替换 出 Cache 的 数据 第 三 次 机 会 ， 而 
Annex Cache 要 求 想 进 入 Cache 的 数据 证 明 自 己 的 价值 。 

“Annex Cachie 有 助 于 防止 很 少 使 用 的 数据 进入 Cache, MA mi mk Cache S32. WFR 
Cache 为 不 常 使 用 的 数据 提供 空间 而 将 频繁 使 用 的 数据 替换 出 去 的 话 ， 其 效率 肯定 不 高 。 在 
启动 时 ;斯 有 数据 块 以 正常 的 方式 进入 Caches 最 初 阶段 后 ， 所 有 进入 Cache 的 数据 都 需要 
通过 Annex, HAEE Cache 发 生 冲突 失效 且 该 失效 块 已 经 在 Annex Cache 中 被 访问 了 两 次 
Ay, Annex Cache 中 的 数据 块 才 会 被 交换 进入 主 Cache。 进 入 Annex Cache 的 数据 必须 被 证 
明 在 时 间或 空间 局 部 性 土 存在 价值 在 实践 中 ;类似 Annex Cache ix PEAY SZ AX Cache 机 制 是 
不 容易 实现 的 ;由 于 附加 功能 的 复杂 性 ; 需要 在 本 来 简单 的 组 相 联 Cache 的 基础 土 增加 大 量 
= 电路 。 


© L. John, A. Subramanian, Annex cache: “A cache assist to: implement selective caching.” Microprocessors and 
Microsystems, Vol: 23, Issues 8-9; December 1999. 
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Trace Cache ; 

Trace Cache 是 由 Intel 公司 设计 的 专用 Cache, Trace Cache 首先 出 现在 IA32 系列 的 
Pentium 4 处 理 器 中 。 事 实 上 ， Pentium 4 的 Trace Cache (取代 了 一 级 Sp 只 有 8KB, 
与 之 相对 比 ， 早 期 的 Pentium 下 的 一 级 Cache 有 16KB。 

Trace Cache 比 传统 的 Cache 更 进一步 ， 并 且 可 以 对 指令 译 码 ; 即 它 存 储 经 过 译 码 的 
指令 。 因 此 ，Trace Cache 不 仅 可 以 起 到 Cache 的 作用 ， 还 可 以 通过 提前 进行 指令 译 码 而 
减少 执行 时 间 。 Re 4 的 Trace Cache ho ee 6 个 微 操作 的 流 
水 线 。 ELT 

Pentium 4 的 Trace Cache itera 用 于 处 理 IA32 复杂 的 字 长 指令 体系 
结构 。 也 可 以 把 Trace Cache 认为 是 一 种 智能 Cache。IA32 和 68000 指令 体系 结构 都 支 
持 超 长 指令 字 ， 它 们 必须 被 译 码 成 数 十 甚至 数 百 个 微 操作 。 由 于 不 会 在 Trace Cache 中 
装 入 太 多 的 这 种 长 指令 ，Intel 提供 了 一 个 简单 的 解决 方案 一 一 对 复杂 操作 码 进行 译 码 ， 
并 将 其 微 操作 存储 在 ] ROM 中 。 当 遇 到 长 指令 时 ， 微 操作 不 缓存 。 相反 ， 将 对 微 代 码 
ROM 中 恰当 的 过 程 调用 插入 Trace Cache。 
~~ Pentium 4 的 Trace Cache 还 包括 有 限 数量 的 FLAMES, 其 操作 涵盖 全 部 的 
Trace Cache, ŽES Pentium 正常 的 前 端 分 支 目 标 地 址 预测 器 相互 独立 。 Trace Cache 分 

. 支 预测 器 使 用 译 码 的 分 支 指令 并 在 预测 的 目 的 地 址 处 获取 被 译 码 的 微 操作 (假设 它们 在 
Trace Cache D 








1.4 -Cache 设计 中 要 考虑 的 因素 


前 面 已 经 说 过 ;由 于 需要 考虑 的 因素 很 多 ，Cache 的 设计 比较 复杂 ， 其 中 一 些 因素 依赖 
于 计算 机 系统 自身 的 属性 。 在 本 节 中 将 讨论 一 些 影响 Cache 系统 设计 的 因素 。 


存储 器 管理 
在 本 章 的 后 面 将 讨论 存储 器 管理 。 在 这 里 只 进行 简要 的 概述 。” Wl Dh) 

， “ 建 拟 存储 器 是 一 种 管理 机 制 ， PEP Sere TT Te Te 

中。 由 存储 器 管理 单元 (memory management unit, MMU) 将 CPU 产生 的 地 址 转换 为 相 





应 的 主 存储 器 中 的 操作 数 地 址 。 在 具有 存储 器 管理 的 计算 机 中 ,操作 数 的 逻辑 地 址 由 计 : 
“ 算 机 生成 并 被 转换 成 主 存储 器 使 用 的 物理 地 址 。 由 于 来 自 CPU 的 地 址 被 转换 成 主 春 储 器 : 
中 数据 的 位 置 ， sci aes ee nba i MMU potion 
HR He bk Bl) YO Sh BE wy RTH KEPT 





1.4.1. 9932 Cache 和 逻辑 Cache 


在 具有 存储 器 管理 单元 的 计算 机 系统 中 ，Cache 可 以 位 于 CPU 和 MMU 之 间 ， 也 可 以 
位 于 MMU 和 物理 内 存 之 间 。 图 1-18 显示 了 这 两 种 情况 。 如 果 在 CPU 数据 终端 上 的 数据 被 
缓存 ， 该 数据 称 为 逻辑 数据 (logical data)， 相 应 的 Cache 43% 4 Cache (logical Cache)。 然 
而 ， 如 果 数 据 经 过 MMU 实现 地 址 转换 后 被 缓存 ， 则 该 数据 称 为 物理 数据 (physical data), 
相应 的 Cache 为 物理 Cache (physical Cache)。 下 面 将 讨论 逻辑 Cache 和 物理 Cache 的 含义 
以 及 它们 之 间 的 权衡 。 
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物理 Cache 缓存 来 自 
主 存储 器 且 经 过 MMU 
进行 地 址 变换 的 数据 


逻辑 Cache 位 于 CPU 
和 MMU 之 间 ， 缓 存 尚 
未 进行 地 址 变换 的 数据 





需要 把 Cache 存 
储 器 放 在 何 处 
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图 1-18 -Cache 的 位 置 


物理 Cache thi! 4 Cache 具有 更 长 的 访问 时 间 ， 这 是 因为 在 物理 Cache 中 直到 MMU 
进行 了 逻辑 地 址 到 物理 地 址 的 转换 后 才 可 以 进行 数据 访问 。 逻 辑 Cache 比 物理 Cache BR, 
是 因为 逻辑 Cache 中 的 数据 可 以 立刻 被 访问 ， 而 不 必 等 待 地 址 转换 。 

假设 在 多 任务 系统 中 发 生 了 上 下 文 切 换 且 要 执行 一 个 新 任务 。 当 新 任务 开始 时 ， 操 作 系 
统 将 相应 的 地 址 转换 表 装 入 MMU。 当 人 逻辑 地 址 到 物理 地 址 的 映射 关系 改变 时 ，Cache 中 数 
据 以 及 相应 的 物理 数据 间 的 关系 被 打破 ; 不 能 使 用 Cache 中 的 数据 ， 且 逻辑 Cache 必须 刷 
Bi. WE Cache 在 上 下 文 切换 时 就 不 需要 刷新 。 

然而 ,使 用 物理 Cache 的 代价 是 在 存储 器 访问 前 需要 额外 的 时 间 来 执行 逻辑 地 址 到 物理 
地 址 的 转换 。 在 实践 中 ， 如 果 把 Cache 页 面 大 小 设置 为 与 存储 器 页 面 大 小 一 样 ， 就 可 以 实现 
Cache 中 的 块 查找 与 虚拟 地 址 变换 并 行 工作 。 微 处 理 器 一 般 使 用 物理 Cache 来 减少 切换 上 下 
文 之 后 导致 对 Cache 的 刷新 。 


1.4.2 Cache 电气 特性 


本 书 将 在 下 一 章 中 介绍 主 存储 器 系统 ， 这 里 先 对 Cache 的 电路 设计 进行 简要 说 明 。 半 
导体 随机 访问 存储 器 有 两 大 类 : 静态 (static) 和 动态 (dynamic)。 静 态 存储 器 利用 传统 数字 
逻辑 将 一 位 数据 存储 在 二 个 触发 器 中 一 一 正如 在 《计算 机 组 成 原理 》 第 2 章 中 描述 的 那样 。 
静态 存储 器 的 特点 是 低 功 耗 、 高 速 和 只 要 有 电 就 能 够 保留 数据 。 因 此 ，Cache 通常 由 静态 
RAM 构造 。 不 幸 的 是 ， 它 需要 6 个 晶体 管 来 存储 一 个 比特 位 ， 因 此 ， 静 态 存储 器 单元 的 物 
理 尺寸 ( 即 所 占 硅 片 的 面积 ) E DRAM 单元 要 大 得 多 。 这 意味 着 ， 静 态 存 储 器 比 DRAM 更 
昂贵 且 容 量 较 小 ， 因 此 不 能 用 来 构造 大 容量 的 Cache。 

动态 存储 器 (DRAM) 通过 对 单个 晶体 管 的 电容 充 士 电荷 来 保存 数据 。 这 使 得 DRAM 
非常 便宜 和 紧凑 ， 可 以 用 来 构造 大 容量 存储 器 。 不 幸 的 是 ，DRAM 需要 更 多 的 电量 进行 控 
制 ， 且 电容 中 的 电量 在 几 ms 内 就 会 漏 光 。 为 了 保存 DRAM 中 的 数据 ， 必 须 每 隔 4ms 左右 
定期 读 取 存储 单元 中 的 数据 并 将 其 写 回 。DRAM 不 适 于 构建 Cache。 


1.4.3 Cache 一 致 性 
Cache 中 的 数据 也 在 主 存储 器 中 。 当 处 理 器 在 写 周 期 内 修改 数据 元 素 时 ， 必 须 对 主 存储 
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器 和 Cache 中 的 数据 副本 进行 修改 ， 虽 然 这 种 修改 不 必 是 同时 的 。 因 此 ， 可 能 会 出 现 一 个 
数据 存在 两 个 不 同 副本 的 情况 。 如 果 Cache 中 的 数据 被 修改 ， 而 主 存储 器 的 数据 没有 被 修 
改 (或 倒 过 来 )， 旧 的 、 没 有 被 修改 的 数据 称 为 过 时 的 《stale) 数据 。 读 者 可 以 想象 ， 这 种 情 
况 可 能 会 导致 严重 的 错误 。 假 设 IO 控制 器 使 用 DMA 试图 从 主 存储 器 移动 一 块 数据 到 磁盘 
上 ,此 时 处 理 器 刚刚 更 新 了 其 Cache 中 的 数据 但 尚未 修改 主 存储 器 中 的 数据 副本 。IO 控制 
器 将 把 过 时 的 数据 而 不 是 把 Cache 中 最 新 的 数据 从 主 存储 器 移动 到 磁盘 上 。 

Cache 一 致 性 (cache consistency) 有 时 被 称 为 数据 一 致 性 (data consistency)。 图 1-19 
中 给 出 了 这 样 一 个 系统 ， 两 个 处 理 器 共享 一 个 存储 器 。 假 设 在 此 多 处 理 器 系统 中 的 处 理 器 1 
执行 了 存储 器 写 操 作 ， 只 更 新 了 自己 的 局 部 Cache 而 没有 写 和 存储器。Cache 中 的 存储 器 中 
的 数据 拷贝 是 不 一 致 的 。 这 种 情况 将 持续 到 存储 器 写 可 〈( write back) 操作 将 数据 更 新 。 如 
果 处 理 器 2 在 数据 更 新 前 读 取 存 储 器 中 相同 位 置 的 数据 ， 它 从 存储 器 中 访问 到 的 就 是 过 时 的 
数据 。 


处 理 器 2 


元 素 :Q 位 于 
存储 器 与 两 个 
局 部 Cache 中 


1-19 Cache 一 致 性 问题 


当 多 个 处 理 器 都 有 自己 的 局 部 Cache 时 也 会 发 生 类 似 的 问题 。 假 设 处 理 器 和 同时 更 新 
了 自己 的 局 部 Cache 和 共有 的 存储 器 。 处 理 器 Y 也 可 能 在 其 局 部 Cache 中 缓存 了 相同 数据 
的 一 个 副本 。 处 理 器 Y 并 不 知道 它 缓 存 的 数据 已 经 是 过 时 的 。Cache 一 致 性 这 个 术语 意味 着 
在 不 同 的 Cache 和 主 存储 器 中 的 数据 必须 保持 同步 ( 即 没 有 过 时 的 数据 )。 使 Cache 和 主 存 
储 器 中 的 数据 保持 一 致 ( 即 保证 Cache 一 致 性 ) 是 设计 多 处 理 器 系统 时 需要 主要 考虑 的 问题 
RF 

有 些 处 理 器 通过 一 种 被 称 为 总 线 侦 听 (bus snooping) 的 技术 来 保持 Cache 的 一 致 性 。 
处 理 器 通过 监视 地 址 流 和 数据 流 发 现 那些 向 主 存储 器 的 写 访问 、 同 时 在 自己 的 Cache 中 也 有 
一 个 副本 的 情况 。 当 主 存储 器 中 的 数据 被 修改 ,该 处 理 器 局 部 Cache 中 的 内 容 可 以 被 标记 为 
无 效 ， 或 将 其 Cache 更 新 。 


1.4.4 RR 


块 是 Cache 中 的 基本 存储 单位 。 一 个 重要 的 问题 是 ， 要 多 大 的 块 才能 获得 最 佳 性 能 ? 针 
对 块 大 小 和 Cache 性 能 之 间 的 关系 已 经 展开 了 大 量 的 研究 ， 有 时 是 通过 模拟 软件 的 Cache 操 
作 ， 有 时 是 通过 监控 计算 机 系统 中 真实 Cache 的 操作 。 
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KBE | : 
| 前 面 已 经 恋 到 了 Cache 的 命中 率 (hit ratio) h, 表示 访问 操作 在 eae 中 发 现 才 据 
的 比例 。 趴 型 的 命中 率 在 090 一 0.98 之 间 。 
”失效 率 代表 访问 操作 没有 在 Cache 中 发 现 数据 的 比例 ， 由 由 = 1 表示 。 显 然 ， 无 
“ 论 使 用 有 还 是 丰 都 是 可 行 的 。 但 是 ， 当 比较 两 个 高 性 能 Cache 时 ， 广 的 值 可 以 是 0.98 或- 
0.99， 差 异 仅 有 1%。 但 是 ， 从 失效 率 的 角度 看 ， WKT EO EO 01， 它们 之 i 
AER. A, 计算 机 科学 家 们 发 现 使 用 7 mm 可 以 带 来 更 多 的 启发 。 5 








最 佳 的 块 容量 取决 于 几 个 方面 ， 充 其 是 正在 执行 的 程序 的 性 质 。 负 责 控制 处 理 器 和 存 全 
器 之 间 数 据 流 量 的 总 线 协 议 也 会 影响 ,Cache. 的 性 能 。 典型 计算 机 的 总 线 负责 将 地 址 传送 到 主 


存储 器 ,然后 从 数据 总 线 发 送 或 接收 一 个 数据 字 一 一 每 次 存储 器 访问 都 需要 一 个 地 址 和 一 个 
数据 元 素 。 假 设 总 线 可 以 工作 在 突 发 模式 (burst mode)， 即 发 送 一 个 地 址 ， 然 后 获得 一 批 连 
续 的 数据 值 。 显 然 ， 这 样 的 总 线 相对 每 次 只 能 传输 一 个 数据 元 素 的 总 线 来 说 能 更 好 地 传输 较 
大 的 块 。 另 一 个 决定 最 佳 块 容量 的 因素 是 指令 和 数据 的 混合 情况 。 针 对 指令 的 最 佳 块 容量 并 
不 一 定 与 针对 数据 的 最 佳 块 容量 相同 。 

假设 块 容量 非常 小 。CISC 微 处 理 器 ， 如 Intel IA32 系列 ， 具 有 可 变 长 度 指令 ， 其 范围 
从 2 个 到 10 个 或 更 多 的 字 节 。 对 于 很 长 的 指令 ， 可 能 会 出 现 指令 的 一 部 分 在 某 个 块 中 缓存 
而 另 一 部 分 在 另 一 个 块 中 缓存 的 情况 。 当 读 取 这 样 的 一 条 指令 时 ， 必 须 两 次 访问 Cache。 增 
加 块 大 小 减 小 了 多 次 访问 Cache (或 称 为 块 交 叉 ，line crosser) MMR. 

增加 块 容量 会 提高 Cache 的 效率 ; 因为 数据 对 象 ( 例 如， 指令 、 向 量 或 线性 表 ) 是 由 一 
组 连续 的 字 节 组 成 的 ， 可 以 利用 空间 局 部 性 原理 。 然 而 ， 当 块 容量 不 断 增加 ,命中 率 也 会 下 
降 ， 因 为 减少 了 块 的 数量 使 得 给 定 对 象 被 缓存 的 概率 降低 。 此 外 ， 大 的 块 的 性 能 很 大 程度 上 
依赖 于 数据 访问 的 局 部 性 。 当 发 生 失 效 将 一 块 调 入 Cache 时 ， 它 可 能 包含 不 经 常 访问 的 数 
据 ， 反 而 把 经 常 访问 的 数据 替换 出 去 了 。 
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MRAR 例如 Xx[0,0] 的 下 一 个 数据 是 [0 EG ARMA RAR 可 以 充分 利用 空间 ‘ 
局 部 性 ， 因 为 元 素 x[ij] 将 导致 x[i,j+1] RRA, 前 提 是 它们 在 同一 块 中 。 每 次 以 列 Oa $ 
式 访 问 元 素 时 都 可 能 会 产生 失效 ， 这 是 因为 连续 两 个 被 访问 的 数据 不 在 同一 决 中 。 


图 1-20 给 出 了 数据 访问 的 块 容量 和 Cache 容量 之 间 的 关系 。 这 些 经 典 的 结果 是 通过 模 
拟 得 到 的 ， 当 时 Cache 的 容量 比 现在 的 要 小 得 多 。 图 1-20 画 出 的 是 失效 率 而 不 是 命中 率 的 
情况 。 每 条 曲线 对 应 一 个 特定 的 Cache 容量 (从 32B ~ 32KB)。 图 1-21 提供 指令 Cache 的 
相应 结果 。 数 据 Cache 的 失效 率 首先 逐渐 变 好 ( 即 越 来 越 小 ) 然后 逐渐 恶化 ( 即 越 来 越 大 ) 
直到 块 容量 与 Cache 容量 本 身 相 等 ; 而 指令 Cache 的 失效 率 随 块 容量 的 增加 而 减 小 。 这 表 
AA, 访问 的 局 部 性 对 指令 的 作用 比 对 数据 的 作用 更 强 。 一 般 情况 下 ， 只 要 给 定 Cache 容量 就 
有 一 个 最 佳 的 块 容量 ; 例如 256B 的 Cache， 最 佳 块 容量 为 64B。Cache 容量 越 大 ， 最 佳 的 
块 容量 就 越 大 。 
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数据 Cache 的 平均 失效 率 ， 
Cache 容量 从 32B ~ 32KB 





F 2 2 3 2° 3! 
块 容量 (单位 : 字 节 ) 
图 1-20 数据 Cache 的 平均 失效 率 与 块 容量 的 关系 (每 条 曲线 对 应 给 定 的 Cache 容量 ) 


(block) size chioice for CPU cache memories," IEEE Transactions on 
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指令 Cache 的 平均 失效 率 ， 
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gr 2° O° z 
块 容量 (单位 : 字 节 ) 
图 1-21 指令 Cache 的 平均 失效 率 与 块 容量 的 关系 (每 条 曲线 对 应 
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(block) size chioice for CPU cache memories,” IEEE Transactions on 


is © 2009 IEEE. Reprinted, with permission, from. Alan Jay Smith, “Line 
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定 的 Cache 容量 ) 


1.4.5 BERR 


有 几 种 策略 可 以 用 于 降低 失效 率 ， 从 而 提升 Cache 性 能 (例如 ， 按 需 获 取 、 预 取 、 选 
择 性 获取 ) O, RRR (demand fetch) 策略 在 失效 后 调 人 所 需 块 ， 这 是 一 种 最 简单 的 选择 。 
预 取 (prefetch) 策略 预测 未 来 Cache 的 需求 (例如 ， 如 果 没 有 缓存 块 i+1， 当 访问 块 z 时 也 
调 入 第 计 1 块 )。 实 现 预 取 算法 有 许多 可 能 的 方法 。 选 择 性 获取 (selective fetch) 策略 在 主 存 
储 器 的 部 分 内 容 不 能 被 缓存 的 情况 下 使 用 。 例 如 ， 在 多 处 理 器 系统 中 ， 由 多 个 处 理 器 共享 的 
数据 就 不 应 该 被 缓存 ， 如 果 这 些 数据 被 缓存 而 处 理 器 修改 了 存储 器 中 的 拷贝 ，Cache 和 存储 
器 中 的 数据 将 不 再 保持 一 致 。 

如 果 需 要 快速 访问 数据 ， 就 应 该 尽早 地 获取 它 。 通过 预 取 (prefetch) 数据 可 以 最 大 限度 
地 发 挥 Cache 的 作用 。 一 些微 处 理 器 的 指令 集 包 括 预 取 指 令 ， 它 只 产生 操作 数 地 址 而 不 做 其 
他 事情 。 当 操作 数 出 现在 总 线 上 时 ，Cache 系统 自动 缓存 这 个 地 址 上 的 数据 该 指令 并 没有 
其 他 功能 ， 只 是 一 个 触发 预 取 的 虚拟 操作 。 


© S.P. Vander Wiel and D.J. Lilja, “When caches aren’t enough: data prefetching techniques,” Computer, July 1997, 
pp.23-30. 


30 RLF 


如 果 ， 在 几 个 指令 后 ， 需 要 访问 预 取 地 址 中 的 数据 ， 相 应 的 数据 已 经 在 Cache 中 。 该 预 
取 操 作 可 由 程序 员 手 工 完成 或 编译 器 自动 优化 过 程 来 完成 。 预 取 不 是 一 门 精确 的 科学 。 如 果 
预 取 得 太 晚 ， 当 CPU 需要 数据 时 ， 它 可 能 不 在 Cache 中 。 男 一 方面 ， 如 果 数 据 预 取得 太 早 ， 
Cache 要 为 新 的 数据 块 腾 出 空间 ， 而 在 CPU 有 机 会 访问 它 之 前 可 能 会 将 其 替换 出 去 。 这 样 
过 早 地 预 取 数据 又 在 使 用 数据 之 前 将 其 替换 ， 就 是 Cache 污染 (cache pollution) 的 例子 。 

预 取 与 循环 密切 相关 ， 这 是 因为 控制 结构 循环 出 现 使 得 可 以 预先 知道 将 使 用 的 数据 。 预 
取 最 简单 的 方式 是 在 访问 数组 元 素 之 前 包括 一 个 预 取 地 址 。 考 虑 表达 式 S$ => 的 计算 。 相 
应 的 代码 是 : 


for (i = 0; i €N; i++){ 
S = ali] + S; 


} 


根据 Wiel 和 Lilja 给 出 的 例子 8 ， 这 里 使 用 fetch (saddress) 来 表示 预 取 操作 和 预 取 的 地 
址 。 预 取 最 简单 的 例子 是 在 循环 中 使 用 地 址 前 访问 该 地 址 ; 即 


for (i = 0; i < Ñ; i++) { 
fetch (a[i + 11); /* 执行 预 取 */ 
S = afi] TS 


} 

这 样 将 产生 下 次 访问 的 地 址 ， 当 再 次 循环 时 ， 计 1 这 个 位 置 已 经 被 访问 。 可 以 在 下 面 两 
个 方面 改进 该 段 代 码 : 一 是 初始 元 素 没有 被 预 取 ; 二 是 由 于 每 次 循环 只 有 一 个 有 效 操作 所 以 
循环 效率 较 低 。 考 虑 下 面 的 代码 : 


fetch (&a[0]}; /* 预 取 第 一 个 元 素 */ 
for (i =-0; i <.N; i= iFa 

fetch (&a[i + 4]; /* 执行 预 取 */ 

S = a[i] + S; 


S = ali+1] + S; 
S = a[i+2] + S; 
S = a[i+3] + S; 


} 


在 这 种 情况 下 ， 一 次 循环 执行 4 个 操作 。 由 于 每 次 取 指 调 人 Cache 中 的 数据 块 中 所 包含 
16 个 字 节 可 以 被 4 个 连续 的 指令 使 用 ， 因 此 只 需要 做 一 次 预 取 。 


1.4.6 多 级 Cache 


在 20 世纪 90 ERER, 存储 器 价格 暴跌 ， 半 导体 技术 可 以 将 非常 复杂 的 系统 放 在 芯片 
上 ， 时 钟 频率 达到 了 500MHz (时 钟 周期 时 间 只 有 2ns)。Cache 系统 的 容量 和 复杂 性 都 增加 
了 ， 计 算 机 系统 开始 实现 两 级 Cache: 在 CPU 内 部 的 一 级 Cache 和 在 主板 上 的 三 级 Caches 
两 级 Cache 系统 中 使 用 少量 速度 非常 高 的 一 级 Cache 和 由 大 量 速度 快 的 存储 器 构成 的 二 级 
Cache。 换 句 话 说， 有 两 个 层次 的 Cache 串 在 一 起 。 首 先 访问 速度 快 、 容 量 小 的 一 级 Cache, 
如 果 没 有 所 需 数据 ， 则 访问 速度 较 慢 、 容 量 较 大 的 三 级 Cache。 如 果 仍然 没有 找到 数据 ， 则 
需要 访问 主 存储 器 。 两 级 Cache 系统 的 访问 时 间 由 一 级 Cache 的 访问 时 间 加 上 二 级 Cache 
的 访问 时 间 再 加 上 主 存 储 器 的 访问 时 间 ; 即 

twe = hita + (I-A, Agta + (17h )(1-h)tm 


© S.P. Vander Wiel and D.J. Lilja, “When caches aren't enough: data prefetching techniques,” Computer, July 1997, 
pp.23-30. 
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其 中 ,hi 为 一 级 Cache 的 命中 率 ; ta 为 一 级 Cache 的 访问 时 间 ; h, 为 二 级 Cache 的 命中 率 ， 
tw 为 二 级 Cache 的 访问 时 间 。 得 到 这 个 公式 是 下 面 3 种 概率 之 和 : 
tve= 访 问 一 级 Cache 的 时 间 十 访问 二 级 Cache 的 时 间 十 访问 主 存储 器 的 时 间 
一 级 Cache 的 访问 时 间 是 ht.,。 如 果 一 级 Cache 发 生 失 效 且 二 级 Cache 命中 ,访问 二 
级 Cache 的 时 间 是 ( 1-h ) ht.,。 如 果 数 据 不 在 两 级 Cache 中 ,访问 存储 器 的 时 间 为 (1-hi ) 
(1-h) tn。 因 此 ， 总 的 访问 时 间 为 : : 
aye = Ayt.y + (=h hates + (1-h)(1 -ha)ts 
该 公式 为 一 个 简化 形式 ， 因 为 没有 考虑 Cache 写 回 和 Cache 加 载 策略 。 考 虑 下 面 这 个 例 
子 。 某 计算 机 有 一 级 Cache 和 二 级 Cache。 访 问 一 级 Cache 没有 开销 ， 需 要 1 个 周期 。 在 二 
级 Cache 中 命中 需要 4 个 周期 。 如 果 没 有 已 缓存 数据 ， 则 访问 主 存储 器 ， 包 括 Cache WME, 
需要 120 个 时 钟 周期 。 如 果 假 设 一 级 Cache 的 命中 率 为 95%， 二 级 Cache 的 后 续 命中 率 是 
80%, 平均 访问 时 间 是 多 少 ? 
te = hita + (1—Ay)Aateg + Lh) Ag) tm 
= 0.95 X 1 + (1-0.95) xX 0.80 X 4 + (1—-0.95) X (1—0.80) x 120 
= 0.95 + 0.16 + 1.20 
=2.31 个 时 钟 周期 
来 自 飞 思 卡 尔 半 导体 公司 应 用 笔记 AN2663 的 图 1-22 给 出 了 命中 率 与 一 级 Cache 及 
二 级 Cache 的 容量 之 间 的 关系 ， 并 用 三 维 图 形 表示 。 可 见 ， 峰 值 命中 率 是 96%， 此 时 执行 
了 特定 的 代码 (GCC 编译 器 )。 该 应 用 笔记 的 结论 是 ，16KB 的 一 级 Cache 和 1KB 的 二 级 
Cache 的 性 能 与 1KB 的 一 级 Cache 和 16KB 的 二 级 Cache 的 性 能 几乎 相同 (虽然 没有 人 会 设 
计 出 一 级 Cache 比 二 级 Cache 大 的 系统 )。 
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图 1-22 命中 率 与 一 级 Cache 及 二 级 Cache 的 容量 


。 早期 计算 机 的 指令 集体 系 结构 是 很 原始 的 ， 程 序 员 需 要 利用 汉 。 诺 依 曼 机 器 
自修 改 代码 。 顾名思义 ， 代 码 可 以 在 运行 时 动态 变化 。 i 
例如 ， 如 果 计 算 机 没有 索引 ， 可 以 编写 如 下 代码 : 
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100 LOAD r0, 2325 
i 101 ADD 100,#1 ri ii 


Se Sg i N o 即 对 上 
ETS TAA NE EET 它 将 变 成 2326， 这 就 是 自修 改 
代码 。 teni 
EE ON N KIRAR RAEE RETA 
Cache 或 存储 器 管理 的 环境 中 工作 ， 因 为 无 法 直接 访问 存储 器 中 的 代码 。 





1.4.7“ 指令 和 数据 Cache 


数据 和 指令 都 是 冯 ， 诺 依 曼 概 念 的 核心 ; 即 它们 共享 相同 的 存储 器 。Cache 设计 者 可 以 
选择 使 用 混合 Cache (unified cache) 来 缓存 数据 和 指令 ,或 者 实现 分 离 的 数据 和 指令 Cache 
( split cache)。 将 数据 和 指令 Cache 分 开 是 很 有 意义 的 ， 因 为 它们 有 不 同 的 特性 。 除 了 将 块 
调 人 Cache 以 外 ， 是 不 会 修改 指令 Cache 中 的 项 目的 。 此外， 不 用 担心 修改 那些 替换 出 指 
S Cache 的 指令 ， 这 是 因为 程序 在 其 执行 过 程 中 不 发 会 变化 。 由 于 指令 Cache 中 的 内 容 不 
会 被 修改 ， 实 现 指令 Cache 要 比 实现 数据 Cache 容易 得 多 。 将 指令 和 数据 Cache 分 别 实现 
可 以 提高 CPU 与 存储 器 间 的 带宽 ， 这 是 因为 指令 和 数据 可 以 同时 读 取 。 对 于 流水 线 系统 来 
说 ， 为 了 实现 指令 和 数据 的 同时 访问 ， 必 须 采 用 分 离 的 指令 和 数据 Cache。 混 合 Cache 和 分 
离 Cache 的 特点 如 下 : 

o 指令 Cache 可 以 为 产生 指令 流 而 优化 。 

e 数据 Cache 可 以 为 读 写 操作 而 优化 。 

e 数据 Cache 可 以 单独 进行 优化 。 

e 指令 Cache 并 不 支持 自修 改 代码 。 

e 混合 Cache 支持 自修 改 代码 s 

e 数据 Cache 可 以 通过 同时 操作 增加 带宽 。 

o 混合 Cache 需要 更 快速 的 存储 器 。 

_ © 混合 Cache 更 加 灵活 (分离 Cache 中 可 能 出 现 指令 Cache 满 而 数据 Cache 还 空 着 一 
半 的 情况 ) 。 

今天 大 多 数 的 处 理 器 都 有 分 离 的 Cache， 即 使 在 具有 多 级 Cache 的 系统 中 。 高 级 别 的 
Cache 可 以 采用 混合 Cache， 而 低级 的 Cache 需要 分 离 Cache. 

图 1-23 中 AMD 的 Barcelona 体系 结构 演示 了 如 何 进行 Cache 的 设计 。Barcelona 是 一 
个 多 核 系 统 ， 每 个 核心 都 有 它 自己 的 64KB 一 级 Cache 和 512KB 的 二 级 Cache。 所 有 4 个 
核心 共享 IMB 的 三 级 Cache。 一 级 Cache 由 两 个 分 离 的 32KB 的 Cache 构成 : 一 个 数据 
Cache 和 一 个 指令 Cache。 传 统 上 ， 多 级 .Cache 的 访问 顺序 是 从 最 低级 Cache 开始 根据 失效 
情况 逐渐 延伸 到 更 高 级 的 存储 层次 〈 先 访问 一 级 Cache, 然后 询问 二 级 Cache， 接 着 是 三 级 
Cache、 主 存储 器 ， 直 到 失效 的 数据 被 找到 )。 在 Barcelona 体系 结构 中 ， 一 级 Cache 是 所 有 
Cache 加 载 的 最 终 目标 ， 所 有 取得 的 数据 都 放 到 一 级 Cache 中 。 二 级 Cache 保存 被 替换 出 一 
级 Cache 中 的 数据 。 因 为 一 级 Cache 和 三 级 Cache 之 间 是 紧 耦 合 的 ， 所 以 从 二 级 Cache 到 
一 级 Cache 传输 数据 所 产生 的 延迟 较 低 。 

三 级 Cache 被 多 个 核 共享 。 加载 数据 时 将 直接 从 三 级 Cache 传 给 一 级 Cache 而 不 通过 
二 级 Cache。 被 传送 的 数据 要 么 由 于 需要 被 多 个 处 理 器 使 用 而 保持 在 三 级 Cache 中 ， 要 么 就 
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因为 不 需要 共享 而 删除 。 与 三 级 Cache 类 似 ， 三 级 Cache 不 保存 来 自 存储 器 的 数据 ， 而 是 保 
存 被 替换 出 二 级 Cache 的 数据 。 i 


Cache 
控制 
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图 1-23 AMD Barcelona 体系 结构 


图 1-24 给 出 了 与 Barcelona 同期 的 Intel Nehalem 架构 ?。 它 的 一 级 Cache、 二 级 Cache 
和 三 级 Cache 的 大 小 分 别 是 32K、256K 和 8M 字 节 。 


Nehalem Quadcore Nehalem Quadcore 
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图 1-24 Intel Nehalem 体系 结构 


与 指令 和 数据 Cache 类 似 ， 一 些 计算 机 还 实现 了 特殊 的 Cache. 例如 ， 在 流水 线 中 引入 
分 支 目 标 . Cache (branch target cache)。 分 支 目 标 Cache 存储 与 分 支 有 关 的 信息 ， 例 如 分 支 
地 址 和 目标 地 址 处 的 指令 操作 码 。 同 样 ， 可 以 在 特殊 的 返回 地 址 Cache 中 保存 子 程序 返回 地 
址 ， 以 减少 当 返 回 地 址 保存 在 堆栈 中 时 从 子 程序 返回 的 开销 。 


1.4.8 5 Cache 
到 目前 为 止 ， 本 章 只 考虑 了 对 Cache 的 读 访问 (访问 最 频繁 的 形式 )。 现 在 来 看 看 更 复 


© Trent Rolf, “Cache organization and memory management of the Intel Nehalem computer architecture,” University of 
Utah, http://rolfied.com/nehalem/nehalemPaper.pdf. 
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杂 的 写 访 问 。 当 处 理 器 写 数 据 到 Cache 时 ， 在 Cache 和 主 存储 器 中 的 相应 块 都 需要 修改 ， 虽 
然 这 两 个 操作 不 需要 同时 执行 。 然 而 ， 必 须 在 下 一 次 访问 前 确保 存储 器 中 的 数据 元 素 副本 已 
被 更 新 ; 即 在 Cache 和 存储 器 中 的 数据 元 素 必须 保持 一 致 。 

前 面 已 经 指出 ， 在 Cache 和 主 存 储 器 并 行 访问 的 系统 中 ， 平 均 访问 时 间 是 tave = At, + (1-A) 
ta (EP, h 为 命中 率 , t X Cache 访问 时 间 , 6 为 主 存储 器 访问 时 间 )。 如 果 数 据 不 在 Cache 
中 ， 它 必须 从 存储 器 中 取出 ， 并 调 入 Cache 和 目的 寄存 器 。 假 定 t, X Cache 失效 时 从 主 存储 
器 中 取出 一 块 并 将 其 放 入 Cache 所 需 的 时 间 ， 存 储 器 系统 的 有 效 平均 访问 时 间 是 Cache 访问 
时 间 、 存 储 器 访问 时 间 、 由 于 失效 导致 的 重新 装载 时 间 (the reloads due to miss) 之 和 : 

tae = At, + (1—h)ta + A-A)t, 

上 和 式 中 新 出 现 的 项 (1-4) 为 失效 后 将 取出 的 块 放 入 Cache 的 额外 时 间 。 该 表达 式 可 以 

改写 为 : 
tve= At, + (1—h) (ta + t) 

访问 导致 失效 的 元 素 与 将 存储 器 中 的 块 调 入 Cache 可 以 同时 进行 。 因 此 (t + ta) 项 应 

该 是 max(t|t,.), AA t>t,, ERTAS: 
tye = At, + (1—A)t, 

现在 来 看 看 写 回 策略 对 该 公式 的 影响 。 当 处 理 器 执行 写 操作 ， 数 据 必须 被 写 到 Cache 和 
主 存储 器 。 在 写 人 Cache 的 同时 也 改写 主 存储 器 中 的 数据 ， 这 称 为 写 直达 ( write-through) 
策略 。 该 策略 导致 系统 变 慢 ， 因 为 写 主 存储 器 的 时 间 比 写 Cache 的 时 间 要 长 。 如 果 下 一 个 操 
作 是 读 Cache， 主 存储 器 可 以 同时 完成 更 新 ( 即 写 直达 策略 并 不 一 定 会 遭受 过 多 的 惩罚 )。 

相对 较 少 的 存储 器 访问 操作 为 写 操 作 。 实 际 上 ， 写 访问 约 占 访 存 操作 的 5% ~ 30%. t% 
下 来 ,使 用 w 表示 写 操 作 的 比例 (0<w<1 )。 如 果 考 虑 读 操 作 发 生 失 效 和 写 操作 发 生 失效 的 
情况 ， 具 有 写 直达 Cache 的 系统 的 平均 访问 时 间 为 : 

twe = ht, + (1—h) (1-w)t, + (1-A)wt, 
其 中 : i 为 Cache 失效 时 重新 装载 所 需 的 时 间 (这 里 假设 采用 不 按 写 分 配 (no-write-allocate ) 
策略 ， 即 写 失效 时 数据 不 调 人 Cache). 

(1 一 有 ) -wi 这 项 代表 读 失 效 时 重新 加 载 Cache 所 需 的 时 间 ， 而 (1—h)wt, 表示 写 失 效 
时 写 人 存储 器 所 需 的 时 间 。 由 于 处 理 器 可 以 在 更 新 主 存储 器 时 继续 完成 另 一 个 操作 ，(1- 门 
wW 如 这 一 项 往往 可 以 忽略 ,这 是 因为 主 存储 器 有 时 间 按 照 写 直达 方式 完成 两 个 连续 的 写 操 
作 。 由 于 假定 计算 机 在 写 失 效 时 不 更 新 Cache， 故 该 公式 不 包括 写 失效 时 将 数据 载 人 Cache 
的 情况 。 

Cache 的 性 能 可 以 通过 写 缓冲 ( write buffer) 来 改进 ， 它 保存 了 等 待 写 人 存储 器 的 数据 。 
典型 的 写 缓冲 保存 4 个 地 址 /数据 对 。 当 然 ， 必 须 保证 处 理 器 要 访问 的 数据 刚 被 更 新 、 不 在 
存储 器 而 在 缓冲 区 中 ， 此 时 ， 处 理 器 可 以 访问 缓冲 区 。 一 种 解决 方案 是 在 执行 读 操作 之 前 允 
许 写 缓冲 完成 存储 器 更 新 。 

另 一 种 修改 存储 器 的 策略 被 称 为 写 回 (write-back)s 在 具有 写 回 策略 的 Cache 系统 中 ， 
向 主 存储 器 的 写 操作 只 有 在 Cache 块 被 蔡 换 时 才 会 发 生 ， 即 对 Cache 的 写 操作 并 不 会 每 次 都 
导致 对 主 存储 器 的 更 新 。 只 有 在 某 块 由 于 读 失效 而 被 替换 出 去 时 才 将 该 块 写 回 存储 器 。 因 此 
上 式 可 以 写 为 : 

t 


ave 


= ht, + (1-hA) (1-w)t, + (1-h) (1—w)t 
= ht, +2(1-h) (1-w)t, 


Cache Ahh B42 WME E 35 


注意 出 现 了 两 个 (C-A) (l-w)t,, KERA RRA EDR RORE AA, NRA 
块 被 调 人 Cache. ae 

Cache 中 的 每 一 块 都 有 一 个 标志 来 描述 当前 块 的 状态 。 例 如 ， 每 个 块 都 有 一 个 脏 ( dirty) 
位 来 表示 它 调 入 Cache 后 是 否 被 修改 过 。 如 果 该 块 没有 被 修改 ， 在 其 被 替换 出 Cache 时 就 不 
需要 写 回 存储 器 。 具 有 这 种 写 回 策略 Cache 的 平均 访问 时 间 由 下 式 给 出 : 

tve = At, + (1—-h) (1—w)t, + (1-A) pwt, 

Ht, p, 为 块 需要 被 写 回 主 存储 器 的 概率 。 

图 1-25 给 出 了 具有 写 回 策略 Cache 的 存储 器 系统 的 决策 树 。 该 图 描述 了 在 读 失效 时 如 
何 修改 Cache 以 及 块 被 修改 后 如 何 写 回 。 发 生 写 失效 时 ，Cache 中 的 块 被 写 回 ， 并 将 新 的 块 
装 人 Cache。 这 些 参 数 导 致 的 平均 访问 时 间 为 : 

tye = ht, + (1-h) (1—w) (1—p,) t + (I-A) (1—w) p, -2t, + (I-A) w- 2t, 
命中 

访问 Cache 中 的 数据 






(干净 块 )A 1-p。) 将 块 写 回 ， 然 后 
再 调 人 新 的 块 
调和 人 新 的 块 


图 1-25 访问 具有 写 回 策略 Cache 的 决策 树 


上 面 给 出 了 不 同 Cache 策略 下 系统 平均 访问 时 间 的 表达 式 。 这 些 表达 式 都 是 近似 的 ， 真 
实 系统 的 行为 将 取决 于 其 具体 实现 。 


ae Bae 
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FORA Sa ESR, RAT, RTE, 使 
第 4 章 中 讨论 的 分 离 事务 总 线 (split transaction bus) 使 之 成 为 可 能 。 






1.5 虚拟 存储 器 和 存储 器 管理 


存储 器 管理 (Memory Management) 是 操作 系统 和 硬件 的 切合 点 ， 它 关注 的 是 管理 主 存 
储 器 和 磁盘 。 从 许多 方面 看 ， 存 储 器 管理 是 一 种 扩展 的 ,Cache HA. 

计算 机 刚 出 现时 ， 计 算 机 生成 的 地 址 对 应 物理 或 真实 存储 器 中 操作 数 的 位 置 。 即 使 在 
今天 ,各 种 控制 器 中 的 8 位 微 处 理 器 通常 不 使 用 存储 器 管理 技术 。 在 PC 和 工作 站 等 高 性 能 
计算 机 上 产生 的 逻辑 地 址 (logical address)， 并 不 是 操作 数 在 存储 器 中 的 物理 地 址 (physical 
address)。 考 虑 指令 LDR r2, [tr3] ， 其 作用 是 将 由 r3 寄存 器 指向 的 存储 器 位 置 中 的 内 容 送 入 
12 寄存 器 ， 假 定 寄存 器 r3 的 内 容 是 0x00011234。 数 据 可 能 来 自 基于 DRAM 的 主 存储 器 中 
0x00A43234 这 个 地 址 。 将 地 址 00011234 翻译 成 00A43234 的 过 程 叫 作 存储 器 管理 (memory 
management) 。 在 本 节 中 ， 将 解释 为 什么 存储 器 管理 是 必要 的 ， 它 是 怎样 实现 的 。 

虚拟 存储 器 (virtual memory) 是 从 光学 领域 借用 的 术语 ， 其 中 虚拟 用 于 描述 一 种 似乎 在 
某 个 位 置 的 虚拟 图 像 ， 例 如 ， 望 远 镜 可 以 使 处 于 很 远 位 置 的 物体 看 起 来 好 像 就 在 面前 一 样 。 
虚拟 存储 空间 是 逻辑 地 址 空间 (logical address space) 的 同义词 ， 用 来 描述 计算 机 可 以 访问 
的 地 址 空间 。 具 有 64 位 地 址 和 指针 寄存 器 的 计算 机 的 虚拟 (逻辑 ) 地 址 空间 为 2” 字 节 ， 即 
使 它 在 系统 中 可 能 只 有 2G ( 2” ) 字 节 的 物理 主 存储 器 。 

存储 器 管理 起 源 于 20 世纪 50 年 代 ~ 60 ER, CREK CPU 产生 的 逻辑 地 址 转化 成 实 
际 地 址 〈 即 物理 地 址 ) 的 所 有 技术 。 存 储 器 管理 允许 DRAM 和 硬盘 的 物理 地 址 空间 无 颖 地 
合并 到 计算 机 的 虚拟 存储 器 空间 中 。 


1.5.1 存储 器 管理 


计算 机 使 用 如 Windows 或 UNIX 这 样 的 操作 系统 对 存储 器 管理 技术 进行 扩展 使 用 。 图 
1-26 给 出 了 一 个 具有 存储 器 管理 单元 (memory management unit, MMU) 的 系统 的 结构 。 原 
则 上 ， 操 作 非 常 简 单 : KA CPU 的 逻辑 地 址 送 入 MMU ， 然 后 被 转换 为 操作 数 在 存储 器 中 
的 物理 地 址 。 将 逻辑 地 址 转换 成 物理 地 址 需要 一 个 查找 表 (look-up table)。 因 为 将 每 个 逻辑 
地 址 都 转换 成 物理 地 址 确实 需要 非常 大 的 表 ， 因 此 存储 空间 通常 被 分 成 页 (page)， 每 个 逻辑 
页 中 的 地 址 被 转换 成 物理 页 中 对 应 的 地 址 。 一 个 页 通常 为 4KB。 例 如 ， 如 果 页 大 小 为 4KB， 
处 理 器 有 32 位 地 址 空间 ， 逻 辑 地 址 OxFFFFAC24 可 能 被 转换 为 0x00002C24。 


字 地 址 





由 GPU 产生 的 地 址 为 逻辑 地 址 ， 存 储 Sais 
Perreau? ther ed Tae Co 
将 其 转换 为 物理 地 址 的 高 位 ， 从 而 产生 

， Zit 
存储 器 中 操作 数 的 实际 地 址 。 逻辑 页 被 OL Oe 
转换 为 物理 页 。 页 中 的 字 地 址 并 不 变化 


图 1-26 存储 器 管理 单元 
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处 理 器 逻辑 地 址 空间 的 大 小 与 指定 操作 数 的 寻 址 方式 无 关 。 它 也 与 程序 是 用 高 级 语言 、 
汇编 语言 还 是 机 器 代码 编写 无 关 。 在 32 位 的 系统 中 ， 指 令 LDR ra, [re] 允许 使 用 4GB WE 
辑 空 间 。 无 论 采 用 何 种 技术 ， REAR RAE R OY AE ARE 
这 仅仅 是 因为 其 程序 计数 器 的 位 数 是 有 限 的 32 位。 

物理 地 址 空间 由 处 理 器 使 用 存储 器 系统 中 所 有 的 实际 地 址 位 置 构成 。 该 存储 器 不 是 抽象 
的 ， 是 真正 实现 的 。 换 多 话说 ,系统 的 主 存储 器 构成 物理 地 址 空间 。 计 算 机 逻辑 地 址 空间 的 
大 小 由 指定 地 址 所 需 的 位 数 决定 ， 而 物理 地 址 空间 的 大 小 通常 只 受 其 成 本 限制 。 

现在 可 以 看 到 ， 为 什么 微 处 理 器 的 逻辑 和 物理 地 址 空间 的 大 小 是 不 同 的 。 更 奇怪 的 
是 为 什么 微 处 理 器 使 用 存储 器 管理 ， 将 例如 0x00001234 这 样 的 逻辑 地 址 转换 为 物理 地 址 
0x861234。 存 储 器 管理 系统 的 基本 目的 如 下 : 

1 ) 实现 对 物理 地 址 空间 大 小 超过 了 逻辑 地 址 空间 大 小 这 样 的 系统 的 控制 〈 例 如， 某 8 
位 微 处 理 器 具有 16 位 地 址 总 线 ( 64KB 的 逻辑 空间 ) 来 访问 2MB 的 物理 内 存 )。 

2 ) 实现 对 逻辑 地 址 空间 大 小 超过 了 物理 地 址 空间 大 小 这 样 的 系统 的 控制 (例如 ， 某 :32 
位 微 处 理 器 具有 4GB 的 逻辑 地 址 空间 ， 管 理 64MB 的 RAM). 

3) 存储 器 保护 ,包括 防止 一 个 用 户 访 问 分 配给 另 一 个 用 户 的 存储 空间 的 机 制 。 

4) 存储 器 共享 ， 一 个 程序 可 以 与 男 一 个 程序 共享 资源 (例如 ， 公 共 数 据 区 或 公共 代码 )。 

5 ) 高 效 利用 存储 器 ， 最 有 效 地 使 用 物理 地 址 空间 。 

6 ) 将 程序 员 从 考虑 程序 和 数据 应 该 位 于 存储 器 的 何 处 中 解放 出 来 。 即 程序 员 可 以 根据 
其 意愿 使 用 任意 的 地 址 , 而 存储 器 管理 系统 会 将 逻辑 地 址 映射 到 可 用 的 物理 地 址 。 

一 个 真正 的 存储 器 管理 单元 可 以 不 必 实 现 上 述 所 有 目标 (注意 前 两 个 目标 是 互 斥 的 )。 
第 二 个 目标 ( 即 逻 辑 地 址 空间 大 于 物理 地 址 空间 ) 对 于 设计 64 位 系统 尤其 重要 。 当 针对 该 
问题 使 用 存储 器 管理 时 ， 这 就 是 经 常 所 说 的 虚拟 存储 器 技术 (virtual memory technology). 
虚拟 存储 器 几乎 就 是 逻辑 存储 器 的 代名词 。 

可 用 物理 地 址 空间 小 于 处 理 器 的 逻辑 地 址 空间 是 由 于 经 济 问 题 所 造成 的 ， 并 一 直 困 扰 
着 主流 企业 。20 世纪 50 年 代 末 ， 大 型 机 可 使 用 大 的 逻辑 地 址 空间 ,但 只 能 使 用 2K 左右 的 
RAM。 英 国 曼 彻 斯 特大 学 的 一 组 计算 机 科学 家 提出 存储 器 管理 技术 ( 现 被 称 为 虚拟 存储 器 ) 
来 解决 该 问题 。 他 们 将 部 分 的 逻辑 (虚拟 ) 地 址 空间 映射 到 可 用 的 物理 地 址 空间 ， 如 图 1-27 
所 示 。 该 例 中 ，256KB 的 一 段 逻辑 地 址 ， 范 围 从 780000 一 7BFFFF， 被 映射 到 物理 存储 器 
范围 从 00000 ~ 3FFFF 的 区 域 。 只 要 处 理 器 访问 逻辑 地 址 空间 中 的 数据 ， 其 地 址 将 被 映射 
到 相应 的 物理 地 址 ， 一 切 都 很 顺利 。 这 里 假定 从 CPU 发 出 的 地 址 将 直接 ( 即 不 改变 地 ) 交 给 
系统 的 地 址 总 线 。 


地 址 空间 
16MB 逻辑 地 址 空间 








256KB 物理 地 址 空间 
=] 0 0000 


16MB — 
13 FFFF 


! 在 该 256KB 区 域内 的 逻辑 地 址 将 被 映 
射 到 相应 的 物理 空间 00000 一 3FFFF 中 


1-27 将 逻辑 地 址 空间 映射 到 物理 地 址 空间 
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当 处 理 器 产生 操作 数 的 逻辑 地 址 不 能 被 映射 到 可 用 的 物理 地 址 空间 时 就 会 出 现 问题 。 曼 
彻 斯 特大 学 采用 的 解决 方案 非常 简单 。 每 当 处 理 器 生成 没有 物理 地 址 对 应 的 逻辑 地 址 时 ， 操 
作 系统 中 止 当前 程序 的 执行 并 处 理 该 问题 。 操 作 系统 从 磁盘 存储 器 中 取出 一 块 包含 所 需 操 作 
数 的 块 ， 并 把 该 块 放 在 物理 存储 器 中 (覆盖 所 有 旧 的 数据 )， 然 后 告诉 存储 器 管理 单元 ， 逮 
辑 地 址 空间 和 物理 地 址 空间 之 间 存 在 一 个 新 的 关系 。 换 句 话说， 程序 或 数据 被 保存 在 磁盘 
中 ， 只 有 当前 需要 的 部 分 程序 被 传送 到 物理 RAM 中 。 存 储 器 管理 单元 跟踪 由 处 理 器 产生 数 
据 的 逻辑 地 址 与 该 数据 在 物理 存储 器 中 位 置 之 间 的 关系 。 整 个 过 程 非常 复杂 ， 需 要 在 处 理 器 
体系 结构 、 存 储 器 管理 单元 以 及 操作 系统 之 间 进 行 协调 。 人 们 希望 看 到 简单 的 虚拟 存储 器 系 
统 ， 但 实际 这 是 一 场 焉 梦 。 


两 个 处 理 器 的 故事 

第 一 代 处 理 器 ( 非 更 旱 的 Intel4004) 有 16 位 的 寄存 器 和 地 址 总 线 ， — 
2"=64KB 的 地 址 空间 。 虽 然 只 可 以 访问 64KB 的 存储 器 ;但 在 20 世纪 70 T 

还 是 比较 大 的 存储 器 ， 处 理 器 应 用 一 般 只 使 用 比 64KB 少 的 物理 存储 器 。 

当 Motorola 推出 了 68000 处 理 器 ， 其 地 址 寄存 器 为 32 位， 提供 2 FY 
间 。 该 地 址 空间 是 线性 的 、 连续 的 ， 不 能 以 任何 方式 划分 。 然 而 ， 为 了 降低 制造 成 本 ， 
| 68000 只 有 24 个 地 址 引 脚 ， 具 有 2 =16MB 的 物理 地 址 空间 。 十 六 进 制 的 32 位 地 址 表 
“aA XXYYYYYY,,, HP YYYYYY 表示 物理 地 址 ，XX 代表 8 个 “无 所 谓 ” 位 ， 这 是 
因为 它们 不 能 通过 地 址 总 线 访问 。 当时 ， 16MB 的 存储 空间 被 认为 是 非常 大 的 物理 地 址 
žie 
Intel 通过 其 8 位 的 8080 和 16 位 8086 击败 Motorola 而 占有 了 市 场 。 不 像 68000 A 

| 有 32 位 地 址 寄存 器 ，8086 只 有 16 位 地 址 寄存 器 (包括 程序 计数 器 PC )， 使 逻辑 地 址 空 
间 限 制 为 64KB。8086 通过 被 称 为 分 段 ( segmentation) 的 技术 来 访问 2” 字 节 的 存储 器 。 
当 8086 产生 一 -个 16 位 的 地 址 ， 它 被 增加 到 20 位 ， 使 得 新 地 址 可 以 访问 IMB 的 空间 。 
I 8086 有 4 ARFER ( segment registers) 克 许 程序 员 访 问 1MB 物理 存储 器 中 的 4 个 ` 
TR. REPRARAR. KER. FRAME, 分 别 用 CSHEAB. DSF A 
B ESREASRSSREAR HR, . 
: 可 以 将 从 地 址 寄存 器 取出 的 16 IHL Lk EARS 416 ERAS! 20 位 地 
址 ; 即 地 址 由 及 +16S 得 到 ， 其 中 及 是 一 个 指针 ，S 为 一 个 段 寄存 器 。 虽 然 相当 麻 烦 ， 但 _ 
Intel 的 寻 址 机 制 提供 了 一 种 实现 单独 的 代码 /数据 /堆栈 地 址 空间 、 并 使 重 定位 十 分 简 
单 的 途径 。 如 果 要 在 存储 器 中 重新 定位 ， 小 于 64KB 的 代码 片 
段 不 必 重 新 编译 。 ; 





1.5.2 ”虚拟 存储 器 


虚拟 存储 器 系统 有 4 个 作用 : 支持 比 物理 地 址 空间 更 大 的 逻辑 存储 空间 ， 实 现 逻 辑 地 址 
到 物理 地 址 的 映射 为 逻辑 地 址 空间 中 运行 的 任务 分 配 物 理 存储 器 ， 更 加 方便 地 建立 多 任务 
的 系统 。 

使 用 有 限 的 文字 就 能 讨论 清楚 虚拟 存储 器 的 所 有 话题 是 不 可 能 的 。 设 计 者 和 程序 员 组 成 的 
团队 花费 很 长 的 时 间 来 设计 虚拟 存储 器 系统 ， 这 是 因为 虚拟 存储 需 的 管理 不 仅 复 杂 而 且 几 乎 在 
支持 多 用 户 或 多 任务 操作 系统 的 系统 中 通常 都 是 各 不 相同 的 。 本 节 只 对 虚拟 存储 器 进行 概述 。 
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1. 存储 器 管理 和 多 任务 

多 任务 系统 通过 周期 性 地 在 任务 之 间 进 行 切换 以 支持 两 个 或 多 个 进程 同时 执行 。 显 然 ， 
多 任务 处 理 只 有 当 几 个 任务 同时 驻 留 在 主 存储 器 中 时 才 是 可 行 的。 如 果 任 务 每 次 运行 都 必须 
从 硬盘 装载 ， 则 切换 新 任务 需要 的 时 间 将 过 长 。 

图 1-28 演示 了 具有 两 个 任务 的 系统 中 如 何 将 逻辑 地 址 空间 映射 到 物理 地 址 空间 。 图 中 ， 
任务 A 和 B 同时 驻 留 在 物理 存储 器 中 。 每 个 任务 都 有 其 自己 的 逻辑 存储 空间 (例如 ， 程 序 和 
堆栈 ) 可 以 访问 位 于 物理 存储 空间 的 共享 资源 。 程 序 员 可 以 完全 自由 地 为 任务 的 不 同 组 件 选 
择 其 自身 的 地 址 。 因 此 ， 图 1-28 中 ,任务 A 和 B 可 以 访问 物理 存储 器 中 相同 的 数据 结构 ， 
即使 它们 使 用 不 同 的 逻辑 地 址 。 即 每 个 任务 只 知道 自己 与 另 一 个 任务 共享 数据 的 一 个 副本 。 


逻辑 地 址 空间 物理 地 址 空间 


gf [wee = re 任务 A 的 数据 


共享 数据 





任务 B 
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图 1-28 多 任务 环境 中 的 地 址 映射 


存储 器 管理 单元 将 程序 员 选 择 的 逻辑 地 址 映射 到 物理 存储 器 空间 ， 而 操作 系统 负责 建立 
逻辑 地 址 到 物理 地 址 的 映射 表 。 当 创建 一 个 新 的 任务 时 ， 将 告知 操作 系统 任务 对 存储 器 的 
需求 。 操 作 系统 搜索 可 用 的 物理 存储 器 空间 ， 寻 找 空闲 的 存储 块 并 将 其 分 配给 任务 。 可 以 想 
R, 一段 时 间 后 ,物理 存储 器 空间 可 能 会 变 得 支离破碎 ， 每 个 任务 占用 不 同 的 存储 块 ， 以 非 
常 复杂 的 方式 交织 在 一 起 。 一 个 好 的 操作 系统 应 该 有 效 地 执行 存储 器 分 配 ， 不 允许 物理 存储 
器 中 存在 大 量 未 使 用 的 块 。 存储 器 分 块 的 方式 取决 于 存储 器 映射 实现 的 方式 和 操作 系统 。 

存储 器 映射 的 一 个 强大 功能 是 ， 每 个 逻辑 存储 器 块 可 被 赋予 各 种 权限 。 例 如 ， 存 储 器 可 
以 是 只 读 、 只 写 、 只 能 通过 操作 系统 或 给 定 的 任务 访问 或 在 一 组 任务 之 间 共 享 。 通 过 确保 
物理 存储 器 块 只 能 被 预先 定义 的 任务 访问 ， 可 以 确保 一 个 任务 的 执行 不 会 导致 另 一 个 任务 裔 
溃 。 有 两 种 实现 存储 器 管理 的 基本 方式 。 使 用 固定 大 小 的 存储 器 块 ， 称 为 页 (page); 另 一 种 
使 用 可 变 大 小 的 存储 器 块 ， 称 为 段 (segment)。 

2. 地 址 翻译 

存储 器 管理 提供 了 两 种 不 同 的 服务 。 第 一 种 是 将 逻辑 地 址 映射 到 可 用 的 物理 存储 器 中 。 
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BORAR EEAS AREY (Eh HE AN EL ERE, 逻辑 地 址 到 物 
理 地 址 的 映射 已 不 能 完成 )。 

图 1-29 显示 了 一 个 页 式 存储 系统 是 如 何 实现 的 。 该 例 使 用 24 位 逻辑 地 址 总 线 和 512KB 
的 存储 器 系统 。 来 自 处 理 器 的 24 位 逻辑 地 址 被 分 成 16 位 的 偏 移 (被 直接 传 给 物理 存储 器 ) 
以 及 8 位 的 页 地 址 。 页 地 址 指向 处 理 器 当前 访问 的 页 (2°=256 个 页 中 的 一 个 )。 逻辑 地 址 的 
位 移 量 可 以 访问 64KB 页 中 的 2 个 位 置 上 的 数据 。 






p000101000110010 


14111110 
11111111 


ae) | 

驻 留 位 修改 位 

R 位 M 位 512KB 物理 地 址 空间 
图 1-29 ”页 表 和 虚拟 存储 器 


页 表 包 含 256 项 ， 每 一 项 对 应 一 个 逻辑 页 。 例 如 ， 在 图 1-29 中 ，CPU 正 访问 8 位 逻辑 
页 地 址 00000111;。 每 项 包含 3 位 的 页 帧 地 址 ， 是 物理 地 址 最 重要 的 3 位 。 该 例 中 ,物理 页 
地 址 为 110。 逻辑 地 址 从 8+16 位 变 成 了 3+16 4, Ehk 00000111 0000101000110010 被 
映射 到 物理 地 址 110 0000101000110010。 

虽然 在 页 表 中 有 256 个 可 能 的 项 (每 项 对 应 一 个 逻辑 页 )， 物 理 页 地 址 只 有 3 位 ， 它 限 
制 物理 页 只 有 8 个 。 因 此， 随机 访问 存储 器 中 不 同 的 物理 页 不 能 与 每 个 可 能 的 逻辑 页 相对 
WM. 每 个 逻辑 页 地 址 有 一 位 R 字段 与 之 相关 联 表示 驻 留 。 如 果 R 位 置 为 1， 表 示 该 页 当前 在 
物理 存储 器 中 。 如 果 尺 位 被 清 零 ， 对 应 的 页 将 不 在 物理 存储 器 中 ， 页 地 址 字段 的 内 容 将 毫 
KEM. 

每 当 产 生 逻 辑 地 址 且 与 当前 逻辑 页 相关 的 R 位 被 清除 ， 将 发 生 页 故障 (page fault) 事 
件 。 一 旦 开始 访问 某 个 逻辑 地 址 ， 由 于 R 位 被 清除 表示 当前 页 不 在 存储 器 中 ， 当 前 的 指令 
必须 暂停 ， 因 为 它 无 法 完成 。 
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典型 的 微 处 理 器 具有 总 线 错误 输入 引 脚 ， 表 明 存 储 器 访问 无 法 完成 。 当 发 生 这 种 情况 
时 ， 操 作 系统 开始 干预 处 理 。 虽 然 CPU 试图 访问 的 数据 目前 不 在 随机 访问 存储 器 中 ， 但 它 
在 磁盘 中 。 操 作 系统 从 磁盘 检索 包含 所 需 存储 器 位 置 的 页 ， 将 其 加 载 到 物理 存储 器 中 ， 并 相 
应 地 更 新 页 表 。 被 暂停 的 指令 可 以 继续 执行 。 

该 过 程 简 单 吗 ? 完全 不 简单 。 当 操作 系统 从 磁盘 获取 一 个 新 的 页 ， 它 必须 覆盖 一 个 随机 
访问 物理 存储 器 的 页 。 注 意 ， 虚 拟 存储 器 的 一 个 功能 是 允许 使 用 相对 小 的 物理 存储 器 来 模拟 
大 容量 存储 器 。 如 果 要 用 新 页 替换 旧 页 ， 此 时 需要 一 个 策略 选择 替换 哪个 旧 页 。 经 典 的 替换 
策略 是 最 近 最 少 使 用 ( least recently used, LRU) 算法 ， 最 长 时 间 没 有 被 访问 的 页 将 被 新 的 
页 覆盖 (也 就 是 说 ， 如 果 最 近 没有 访问 这 个 页 ， 则 在 不 久 的 将 来 也 不 太 可 能 访问 它 )。 

LRU 算法 已 在 实践 中 被 检验 可 以 很 好 地 工作 。 不 幸 的 是 ， 如 果 采 用 该 策略 ， 操 作 系 统 
必须 知道 每 个 页 是 什么 时 候 被 访问 的 ， 这 需要 复杂 的 硬件 (每 个 页 必须 在 被 访问 后 打上 时 间 
戳 )。 操 作 系统 必须 处 理 的 另 一 个 问题 是 ， 存 储 在 RAM 中 和 保存 在 磁盘 上 的 数据 之 间 的 一 
致 性 问题 。 如 果 从 磁盘 上 读 取 的 页 只 包含 程序 的 信息 ， 它 不 会 在 RAM 中 被 修改 ， 因 此 ， 重 
写 它 不 会 导致 任何 问题 。 然 而 ， 如 果 页 的 内 容 是 数据 表 或 其 他 数据 结构 ， 它 可 能 在 RAM 中 
被 改写 。 在 这 种 情况 下 ， 它 不 能 被 新 的 页 覆盖 。 

在 图 1-29 中 ， 可 以 看 到 ， 页 表 中 的 每 一 项 都 有 一 个 M 位 (修改 位 )。 每 当 页 由 一 个 写 操 
作 访 问 ，M 位 被 置 位 。 当 该 页 需要 被 覆盖 ， 操 作 系统 首先 检查 M 位 ;如 果 被 置 位 ， 则 首先 
需要 将 被 改写 的 页 写 回 磁 盘 ， 然 后 再 取 新 的 页 。 

最 后 ， 当 加 载 新 的 页 后 ,将 修改 地 址 转换 表 ， 清 除 M 位 ,将 R 位 置 位 (表示 该 页 是 有 
效 的 )， 处 理 器 可 以 重新 执行 被 暂停 的 指令 。 

DA, 每 次 页 错误 带 来 的 开销 非常 大 。 只 要 页 错误 比较 罕见 ， 系 统 就 可 以 因为 访问 局 部 
性 而 工作 正常 。 多 数 数据 是 簇 聚 在 一 起 的 ， 所 以 一 旦 从 磁盘 中 载 人 一 页 ， 大 部 分 要 访问 的 数 
据 都 会 在 该 页 中 找到 。 如 果 数 据 不 是 有 序 组 织 的 或 有 许多 不 相关 的 任务 ， 处 理 器 将 花费 几乎 
所 有 的 时 间 用 于 交换 页 ， 系 统 的 有 效 工 作 将 停顿 。 这 种 情况 被 称 为 持 动 (thrashing)。 拌 动 
是 指 一 种 频繁 访问 资源 导致 计算 机 性 能 急剧 下 降 的 行为 。 然 而 ， 拌 动 在 很 大 程度 上 是 指 由 于 
需要 加 载 和 重新 加 载 页 而 导致 虚拟 存储 器 系统 发 生 故 障 的 情况 。 

3. 两 级 表 

图 1-29 给 出 的 情况 在 现代 高 性 能 处 理 器 中 实际 不 存在 。 假 设 一 个 32 位 的 计算 机 使 用 
13 位 偏 移 ( 偏 移 指 的 是 页 内 地 址 ) 访问 8KB 的 页 。 这 使 得 可 以 使 用 32-13=19 位 来 选择 2” 
个 逻辑 页 。 在 快速 RAM 中 不 可 能 构建 这 样 大 的 页 表 ( 注 意 ， 相 同 问题 在 Cache 的 设计 中 也 
存在 )。 

图 1-30 给 出 了 怎样 使 用 多 级 (multi level) 页 表 来 实现 地 址 转换 而 不 需要 大 容量 的 页 表 。 
来 自 计 算 机 的 逻辑 (虚拟 ) 地 址 首先 被 分 为 19 位 的 页 地 址 和 13 位 的 页 内 偏 移 。 页 地 址 进 一 
步 被 分 为 对 应 第 一 级 页 表 的 10 位 和 对 应 第 二 级 页 表 的 9 位 。 这 两 个 表 分 别 有 2"=1024 项 和 
2°=512 项 。 

图 1-30 HAL, 真正 的 页 表 包 含 更 多 地 址 转换 过 程 的 信息 而 不 仅仅 是 指针 s 图 1-31 
给 出 了 PowerPC 的 地 址 转换 表 。 

真正 的 页 表 结 构 包 括 多 个 指向 其 他 表 的 指针 在 这 种 层次 地 址 转换 表 中 ， 页 表 项 包含 指 
向 下 一 级 的 指针 。 链 表 的 终点 为 实际 物理 页 ， 包 含 了 MMU 所 需 关于 该 页 的 信息 。 在 实践 
中 ， 典 型 的 存储 器 管理 单元 包含 的 页 表 描 述 符 可 以 描述 以 下 信息 。 
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一 级 页 表 


; 16 位 段 内 偏 移 |2 位 页 内 偏 移 


128 项 两 路 指令 TLB, 
128 项 两 路 数据 TLB 


位 页 地 址 对 应 的 标志 


图 1-31 "PowerPC 存储 器 管理 系统 
e 描述 符 类 型 。 描 述 符 类 型 告诉 MMU 表 是 否 存在 下 一 级 。 


e 写 保 护 位 ( Wj。 表 示 其 指向 的 页 不 可 写 。 如 果 W=1， 树 中 的 所 有 后 续 级 别 的 写 保 护 
位 都 为 1。 
o 使 用 位 (U )。 该 位 在 建立 描述 符 表 时 被 操作 系统 初始 化 为 零 。 当 描述 符 第 一 次 被 访 


问 时 ，MMU 自动 将 其 置 为 1。 虚 拟 存储 器 系统 中 ，U 位 用 来 描述 当 页 需要 被 蔡 换 时 ， 
是 否 要 将 物理 页 写 到 磁盘 。 
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e 管理 员 位 ( S)。 当 该 位 被 置 位 ， 所 指向 的 页 只 能 使 用 管理 员 方 式 访问 ( 即 操作 系统 级 
别 的 访问 权限 )。 管 理 员 态 指 的 是 操作 系统 运行 的 状态 ， 具 有 比 用 户 态 更 高 的 优先 权 。 
例如 ， 如 磁盘 这 样 的 IO 设备 只 能 在 管理 员 态 下 访问 。 

e 全 局 共享 位 ( SG )。 设 置 为 1 时 ， 表 示 页 描述 符 可 以 共享 ， 即 如 果 SG=1， 系 统 中 
所 有 的 任务 都 可 以 访问 物理 页 。SG 告诉 MMU, 在 页 表 Cache 中 只 要 保持 该 页 的 一 
个 描述 符 。 转 换 旁 视 缓冲 器 〈translation look-aside buffer, TLB) 是 一 个 小 的 全 相 联 
Cache， 可 以 通过 同时 搜索 所 有 条 目 实现 地 址 转换 。 

e 写 访问 级 别 (WAL)。 通 过 该 描述 符 指出 页 的 最 低 优先 级 。 

e 读 访 问 级 别 。 由 3 位 组 成 ， 用 于 根据 WAL 位 实现 相应 的 读 操 作 。 

eo 限制 域 ( Limit)。 该 域 为 转换 表 的 下 一 级 指出 索引 (index) 值 的 下 限 或 上 限 ; 即 限制 
域 限 制 了 下 一 级 表 的 大 小 。 例 如 ,逻辑 地 址 域 为 7 位 ， 因 此 具有 128 项 。 然 而 ,在 
实际 系统 中 ， 在 本 级 可 能 只 有 不 超过 20 个 页 描述 符 。 通 过 设置 Limit 为 5， 可 以 限 
制 表 项 为 32 个 而 不 是 128 个 。 

e 上 /下 位 (LU)。 表 示 Limit 位 给 出 的 是 下 限 还 是 上 限 。 如 果 LVU=0， 则 Limit RE 
含 索引 的 无 符号 上 限 ， 下 一 级 表 的 所 有 表 索 引 都 必须 小 于 或 等 于 Limit 域 中 的 值 。 如 
果 IL/U=1， 则 Limit 域 包 含 索 引 的 无 符号 下 限 ， 所 有 表 索 引 都 必须 大 于 或 等 于 Limit 
域 中 的 值 。 在 这 两 种 情况 下 ， 如 果实 际 索引 超出 最 大 /最 小 值 范围 ， 将 出 现 Limit E 
例 。 层 次 访问 最 终 得 到 页 描述 符 用 来 执行 实际 的 逻辑 地 址 到 物理 地 址 的 转换 。 

逐 级 访问 多 级 页 表 ( 例 如， 如 图 1-30 所 示 ) 产生 的 页 描述 符 将 被 用 于 实际 的 逻辑 地 址 到 

物理 地 址 的 转换 。 除 了 上 面 给 出 的 描述 符 外 ， 页 描述 符 可 能 还 有 以 下 的 控制 位 : 

e 修改 位 ( M)。 指 示 相 应 的 物理 页 是 否 被 改写 。 由 于 MMU 可 以 将 其 置 位 但 不 会 清除 ， 
故 该 位 在 建立 描述 符 表 时 被 操作 系统 初始 化 为 零 。 注 意 ， 使 用 位 U 在 表 描 述 符 被 访 
问 后 被 置 位 ， 而 M 位 在 页 被 修改 后 置 位 。 

o 锁 位 (L)。 表 示 相 应 的 页 描述 符 应 规避 MMU 的 页 置换 算法 。 当 L=1， 物 理 页 不 能 通 
it MMU 替换。 因此， 可 以 使 用 工 位 来 保持 地 址 转换 Cache 中 的 页 描述 符 。 

e Cache 抑制 位 (Cl) 表明 相应 的 页 是 否 可 以 被 缓存 。 如 果 CI=1， 那 么 该 访问 就 不 能 
被 缓存 。 


本 章 小 结 

使 用 存储 器 可 以 将 指令 和 数据 保存 在 计算 机 中 。 由 于 技术 本 身 的 原因 和 受制 造 技术 发 展 
的 限制 ， 目 前 尚 没有 某 种 单一 的 设备 或 技术 可 以 满足 所 有 的 个 人 计算 机 或 工作 站 的 需求 。 简 
单 地 说 就 是 : 速度 很 快 的 存储 器 价格 昂贵 ， 如 果 便 宜 的 话 速度 就 慢 。 

当 开 发 大 型 计算 机 用 于 满足 政府 、 工 业 以 及 军事 需求 时 ， 设 计 人 员 很 快 发 现 ， 实 际 存储 
器 系统 的 限制 可 以 减少 ， 或 者 说 被 屏蔽 。 的 确 ， 可 以 把 不 需要 的 数据 存储 在 慢 速 的 存储 器 
中 。 用 计算 机 的 话说 就 是 ， 把 经 常 访问 的 数据 保存 在 快速 存储 器 中 ， 而 用 慢 速 存储 器 实现 数 
据 归 档 。 这 种 想法 既 简 单 又 有 效 ， 对 计算 机 性 能 产生 了 重要 影响 。 但 另 一 方面 ， 它 在 实现 起 
来 可 不 简单 。 

计算 机 中 有 两 种 基本 类 型 的 存储 器 : 主 存储 器 中 的 随机 访问 半导体 存储 器 (通常 是 
DRAM) 和 磁 记 录 或 光 存 储 器 等 顺序 访问 的 二 级 存储 器 。 这 两 种 存储 器 系统 使 用 相似 的 技术 
来 克服 其 速度 限制 : 使 用 Cache 存储 器 (cache memory) 来 加 速 主 存储 器 ， 使 用 虚拟 存储 器 
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(virtual memory) 来 加 速 二 级 存储 器 。Cache 存储 器 和 虚拟 存储 器 机 制 的 原理 相似 , 但 在 细 
节 和 实现 技术 上 有 很 大 不 同 。 

本 章 第 一 部 分 介绍 了 用 来 加 速 主 存储 器 的 Cache。 相 对 小 容量 的 Cache (例如 ，4GB 的 
DRAM 使 用 1MB 的 Cache) 可 以 显著 提高 系统 的 性 能 。 因 为 数据 和 指令 不 是 随机 访问 的 ， 
真实 的 数据 和 指令 表现 出 时 间 (temporal) 和 空间 (spatial) 局 部 性 ， 通 常 CPU 需要 访问 存 
储 器 的 数据 /指令 中 超过 90% 的 都 可 以 在 Cache 中 找到 。 如 果 找 不 到 ， 必 须 从 存储 器 中 读 
取 数 据 ， 并 将 数据 副本 放 人 Cache. 

本 章 研究 了 Cache 的 几 个 内 容 ， 如 它 是 如 何 组 织 的 ; 即 物理 存储 器 中 的 数据 是 如 何 被 映 
射 到 容量 较 小 的 Cache 中 的 。 虽 然 直接 映射 Cache 设计 最 简单 ， 本 章 已 经 说 明了 它 具 有 的 局 
限 性 会 降低 其 效率 。 本 章 还 说 明了 如 何 利 用 它 来 构建 组 相 联 Cache 一 一 这 是 一 种 在 所 有 微 处 
理 器 系统 中 都 能 找到 的 Cache 类 型 。 

本 章 的 第 二 部 分 讨论 虚拟 存储 器 。 硬 盘 读 写 速度 比 主 存储 器 的 DRAM 慢 若 干 数量 级 。 
虚拟 存储 器 系统 将 存储 器 通常 划分 为 4KB 的 页 。4KB 的 数据 块 可 以 从 磁盘 中 调和 人 主 存储 器 
中 任意 一 个 4KB 的 页 中 ; 即 物 理 存 储 空间 并 不 像 处 理 器 使 用 的 虚拟 或 者 逻辑 地 址 空间 那样 
是 连续 的 。 当 计算 机 访问 存储 器 ， 存 储 器 管理 单元 将 逻辑 页 地 址 转换 为 物理 页 地 址 ， 然 后 从 
存储 器 中 的 该 页 读 取 数据 。 然 而 ， 如 果 被 访问 的 逻辑 页 不 在 存储 器 中 ， 存 储 器 管理 单元 就 会 
产生 页 故障 ,操作 系统 开始 从 磁盘 中 将 所 需 页 调 人 主 存储 器 中 的 页 。 当 然 ， 如 果 所 有 的 物理 
页 当前 都 在 使 用 ， 操 作 系统 必须 牺牲 一 个 页 ， 替 换 它 ， 再 装 入 新 的 页 。 


习题 
1.1 Cache 是 什么 ?为 什么 计算 机 要 使 用 Cache ? 
1.2 解释 下 列 术 语 的 含义 ? 时 间 局 部 性 ; 空间 的 局 部 性 。 

1.3 试 推导 出 具有 Cache 的 存储 器 系统 的 加 速 比 表达 式 (假定 命中 率 为 h， 主 存储 器 访问 时 间 是 Cache 
访问 时 间 的 k 倍 ,其 中 l) 假设 该 系统 是 一 个 理想 的 系统 ， 不 必 考 虑 时 钟 周期 时 间 的 影响 。 
1.4 对 以 下 的 理想 系统 ， 计 算 加 速 比 S。 每 种 情况 下 ，t 为 Cache 的 访问 时 间 ，6 是 主 存储 器 的 访问 时 

E, h 为 命中 率 。 

a.1,=60ns,t.=3ns,h=0.99 

b. tm = 60 ns, t = 3 ns, h = 0.90 

C. tm = 60 ns, t. = 3 ns, h = 0.80 

d. ta = 60 ns, t, = 3 ns, h = 0.70 

对 以 下 的 理想 系统 ， 计 算得 到 给 定 加 速 比 8 所 需 的 命中 率 ho 

a. t„ = 50 ns, t, = 2 ns, S= 1.5 

b. tna = 50 ns, t. = 2 ns, S = 5.0 

C. t,, = 50 ns, t. = 2 ns, S= 10.0 

d. t, = 50 ns, t, = 2 ns, S= 20.0 

微 处 理 器 的 操作 通常 在 给 定时 间 间 隔 内 完成 〈 即 时钟 周期 的 整数 倍 ) 。 例 如 ， 如 果 时 钟 为 100MHz， 
时 钟 周 期 时 间 就 是 1ons， 所 有 操作 的 时 间 必 须 为 10ns 的 整数 倍 。 下 面 的 数据 中 ,为 处 理 器 的 时 
钟 周期 时 间 ，i 为 主 存 储 器 的 访问 时 间 (包括 所 有 开销 ， 例 如 地 址 译 码 )。 针 对 每 种 情况 ;计算 访 
问 存储 器 实际 需要 的 时 间 。 

a. ty. = 50 ns, ta = 100 ns 

b. taye = 50 ns, fm = 105 ns 
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C. ty. FIOD, = 75. ns 
dt Q0itis) is 
1.7 EITA PERE ASE, TA h HET 100% A 
a. ty. = 20 ns, t,, = 75 ns, t, = 25 ns 
b. tf. = 10 ns, ¢,, = 75 ns, t, = 15-ns 
C. ty. = 20 ns, t, = 75 ns, t. = ng 
1.8 实际 使 用 中 ， ADLA HTE RITA aE Gd BY RS ABBR TE. Alt, KARTA RE EK, A 
为 Cache 对 内 部 操作 没有 作用 寺 执行 一 条 指令 所 需 的 平均 时 间 可 以 写 为 : 
LE F hierna e e Fh Aol A EL AFUE a 
其 中 : 
F internat 为 执行 内 部 操作 所 花 时 间 所 占 的 比例 (0 一 1 之 间 )》; 
F memory 为 执行 存储 器 访问 操作 所 花 时 间 所 占 的 比例 (0 ~ 1 之 间 ); 
tye 为 时 钟 周期 时 间 ; 
万 为 以 时 间 周 期 为 单位 的 Cache 访问 时 间 ; 
ty 为 以 时 间 周期 为 单位 的 Cache’ 失 效 开销 ; 
请 计算 下 列 系统 的 平均 周期 时 间 。 
a. F memati = 20%, to = 20 ns, = h 3 h 0195 
b. Finternat = 50%, tyi = 20 ns, t= 1,:t,=3,h =0.9 
1.9 针对 上 题 中 的 系统 ， 如 果 参 数 变 成 : Fina = 40%, tj. = 20 ns, t= 1, sta = 4， 试 计算 将 平均 指令 时 
间 减 半 所 需 的 命中 率 。 
1.10 主 存储 器 的 数据 是 如 何 映射 到 如 下 Cache 中 的 ? 
a. 直接 映射 Cache 
b. 全 相 联 Cache 
c. 组 相 联 Cache 
1.11 在 一 个 直接 映射 Cache 存储 器 系统 中 ， 下 列 术 语 的 含义 是 什么 ? 
a. 字 
b. 块 
c. 组 
1.12 为 什么 构建 一 个 全 相 联 Cache 很 困难 ? 为 什么 组 相 联 Cache 如 此 受 欢迎 ? 
1.13 画图 说 明 如 何 使 用 Cache 标志 AM 来 实现 直接 映射 Cache。 对 比 直 接 映射 Cache 和 全 相 联 
Cache 的 优 缺 点 。 
1.14 什么 是 Cache 一 致 性 ? 
1.15 突 发 模式 的 操作 是 什么 《在 具有 Cache 的 环境 下 ) ? 
1.16 按 道理 ，Cache 是 非常 简 间 的 概念 ,只 需要 将 经 常 访问 的 数据 放 在 高 速 RAM 中 即 可 。 在 实践 中 ， 
相对 其 他 计算 机 部 件 ;，Cache 存储 器 系统 的 设计 是 很 困难 的 。 这 种 说 法 是 否 正确 ? 
1.17 讨论 工程 师 在 为 Cache 选择 合适 的 块 大 小 (容量 ) 时 需要 考虑 的 因素 。 
1.18 Cache 系统 可 以 位 于 CPU Al MMU 之 间 ( 即 逻辑 Cache) 或 在 MMU 与 系统 随机 访问 存储 器 ( 即 
物理 Cache) 之 间 。 是 什么 因素 决定 了 Cache 的 最 佳 位 置 ? 
1.19 当 CPU 写 Cache 时 ，Cache 中 的 项 和 存储 器 中 对 应 的 项 都 需要 更 新 。 如 果 数 据 不 在 Cache 中， € 
必须 从 存储 器 中 取出 ， 然 后 装 入 Caches WR t 为 Cache 失效 时 重新 加 载 需 要 的 时 间 ; 证 明 存 储 
器 系统 的 有 效 平均 访问 时 间 由 下 式 给 出 : 
tae = ht, + (1—h)t, + (1—h)t, 
1.20 为 什么 设计 数据 Cache 比 设计 指令 Cache 要 困难 ? 
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1.21 Cache 可 以 相对 于 主 存储 器 以 串 行 或 并 行 的 方式 工作 。 在 串 行 访 问 模式 下 ， 在 :Cache 中 查找 数 
据 ， 如 果 发 生 失 效 ， 然 后 再 访问 主 存 。 在 并 行 访问 模式 下 ，Cache 和 主 存储 器 同时 被 访问 。 如 果 
命中 ， 中 止 对 主 存储 器 的 访问 。 假 设 系统 的 命中 率 为 h，Cache 访问 时 间 与 主 存储 器 访问 时 间 的 
比例 为 k (k<1 )。 推 导出 的 并 行 访问 Cache 和 串 行 访问 Cache 加 速 比 的 表达 式 。 

1.22 如 果 使 用 串 行 访问 Cache, 可 以 容忍 其 加 速 比 比 并 行 访问 Cache 的 加 速 比 小 5%， 此 时 命中 率 为 
多 少 才能 达到 要 求 ? 假定 主 存储 器 的 访问 时 间 为 30ns，Cache 的 访问 时 间 为 3ns。 

1.23 什么 是 一 级 Cache 和 二 级 Cache (EP L1 和 LL2 Cache) ? 

1.24 某 系 统 具 有 一 级 Cache 和 二 级 Cache。 一 级 Cachse 的 命中 率 为 90%， 二 级 Cache 的 命中 率 为 
80%。 访 问 一 级 Cache 需要 1 个 周期 ， 访 问 工 级 Cache 需要 4 个 周期 ,访问 主 存储 器 需要 50 个 
周期 。 平 均 访问 时 间 是 多 少 ? 

1.25 计算 机 的 Cache 访问 时 间 为 一 个 周期 ,平均 命中 率 为 95%， 失 效 开销 为 100 个 周期 。 

a. 该 计算 机 的 平均 周期 时 间 是 多 少 ? 

b. 如 果 增 加 二 级 Cache 的 命中 率 为 80%， 其 失效 开销 为 6 个 周期 。 对 平均 周期 时 间 的 影响 如 何 ? 
c. 具有 一 级 Cache 和 二 级 Cache 的 计算 机 执行 了 10000 次 存储 器 访问 。 测 试 程序 运行 时 ,记录 到 
一 级 Cache 失效 了 500 次 ， 二 级 Cache 失效 了 300 次 。 一 级 Cache 和 二 级 Cache 的 总 体 失 效率 是 
多 少 ? ; 

1.26 考虑 多 级 Cache 命中 率 ， 局 部 命中 率 和 总 体 命中 率 之 间 有 何 区 别 ? 

1.27 为 什么 经 常 引 用 (使 用 ) 失效 率 而 不 是 命中 率 ? 什么 是 Victim Cache， 如 何 使 用 它 ? Victim 
Cache 能 够 减少 何 种 类 型 的 失效 ? Victim Cache 和 Annex Cache 的 本 质 区 别 是 什么 ? 

1.28 某 处 理 器 的 存储 器 管理 使 用 4KB 大 小 的 页 。 它 有 一 个 32KB 的 Cache, Cache 块 大 小 为 16B。 为 
了 加 快 存储 器 访问 ， 可 以 使 访问 Cache 与 逻辑 到 物理 地 址 的 转换 同时 进行 。 为 了 实现 该 方案 ， 需 
要 实现 什么 样 的 相 联 度 ? 

1.29 假设 混合 Cache 具有 以 下 特性 : 


Cache 读 写 开销 1 个 周期 
失效 率 3% 

Load 指令 所 占 比例 20% 

Store 指令 所 占 比 例 5% 

失效 开销 20 个 周期 
平均 访问 时 间 是 多 少 ? 


1.30 某 64 位 处 理 器 有 :8MB 的 四 路 组 相 联 Cache， 块 大 小 为 32B。 地 址 位 是 如 何 按 照 组 、 块 、 块 内 偏 
移 位 进行 设置 的 ? 

1.31 某 计算 机 具有 分 离 的 数据 Cache, 采用 写 回 策略 。Cache 块 大 小 为 64B。 读 访问 占 全 部 存储 器 操 
TERS 80%。 处 理 器 、 存 储 器 和 数据 总 线 都 是 64 位 的 。 主 存储 器 访问 延迟 (第 二 次 访问 ) 为 20 个 
周期 ， 后 续 访 问 需要 :2 个 周期 。Cache 命中 率 为 96%。 试 计算 Cache 的 失效 开销 。 

1.32 导致 Cache 失效 的 3 个 原因 是 : 强制 失效 、 容量 失效 和 冲突 失效 。 给 出 这 些 术 语 的 定义 。 简 要 解 
释 如 何 尽量 减少 它们 的 影响 。 

1.33 CPU 中 的 Cache 和 硬盘 中 的 Cache 有 什么 根本 差异 ? 

1.34 为 什么 在 使 用 硬盘 的 系统 中 必须 使 用 存储 器 管理 ? 存储 器 管理 可 以 提供 哪些 保护 功能 ? 存储 器 管 
理 系统 具有 保护 功能 ， 该 功能 在 Cache 中 也 存在 吗 ? 

1.35 写 回 Cache 和 写 直达 Cache 之 间 有 何 差异 ， 对 系统 性 能 有 何 影响 ? 

1.36 32 位 地 址 体系 结构 计算 机 的 存储 器 管理 系统 具有 一 级 4KB 的 页 表 。 该 页 表 对 应 多 大 的 存储 器 空 
间 ? 

1.37 考虑 全 相 联 的 16 字 节 的 Cache 具有 4 个 块 ; BR 4 TF. Cache 使 用 LRU (最 近 最 少 使 用 ) 算法 
处 理 块 蔡 换 。Cache 初始 是 空 的 ， 块 从 第 0 块 开 始 装载 。 
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给 定 下 面 的 十 六 进 制 地 址 序列 ， 指 出 命中 或 失效 情况 。 给 出 所 有 读 操 作 结束 后 Cache 的 状态 。 
00 03 05 08 13.14 11 04 OF 0C 23 00 01 02 04 06 05 07 09 21 
1.38 计算 机 指令 集 具有 下 表 中 的 特点 。 


类 别 指令 频 度 _ jaa 
运算 操作 70% 1 
条 件 操作 15% 2 
Load 操作 10% 2 
Store 操作 5% 2 
命中 率 95% 


Cache 读 失效 开销 10 个 周期 
写 直 达 时 间 5 个 周期 ( 写 人 存储 器 ， 不 缓存 ) 
每 条 指令 的 平均 周期 数 是 多 少 ? 
1.39: 考 虑 下 面 的 代码 ， 访 问 存储 器 中 的 整数 x 和 以 及 整数 向 量 Y[ 跨 这 3 “MA 
for (j = 0; j < 100; j++) ` 


yal? 
S + X; 


n MX 一 


该 系统 具有 一 级 Cache 和 二 级 Cache。 一 级 Cache 的 访问 时 间 是 2 个 周期 ， 二 级 Cache 的 访问 时 
间 是 6 个 周期 ， 主 存储 器 的 访问 时 间 为 :50 个 周期 。 在 此 情况 下 ， 所 有 的 存储 器 和 Cache 的 访问 
是 并 行 执行 的 。 假 设 没有 缓存 数组 ,每 次 新 的 对 数组 的 访问 都 将 导致 失效 。 每 个 循环 中 以 时 钟 周 
期 数 表 示 的 存储 器 延迟 (第 一 次 迭代 后 为 多 少 ? 

1.40 假设 采用 与 题 1.39 相同 的 系统 ， 如 果 采 用 预 取 技 术 ， 每 次 对 主 存储 器 的 访问 将 导致 下 一 块 调和 二 

级 Cache， 此 时 循环 的 平均 存储 器 延迟 为 多 少 ? 假设 对 二 级 Cache 采用 预 取 技术 不 会 导致 进一步 

的 存储 器 访问 开销 。 

某 64 位 计算 机 有 128KB 的 八路 组 相 联 Cache。Cache 有 128 组 ， 每 块 为 16 个 字 。 每 个 地 址 需要 

多 少 位 标志 位 ? 

1.42 哪 种 类 型 的 Cache， 可 以 用 来 减少 由 于 频繁 交换 而 导致 的 Cache 抖动 ? 

1.43 给 定 以 下 数据 ， 假 设 时 钟 频率 为 1000MHz。 


1.4 


_ 


存储 器 命中 时 间 失效 率 
一 级 Cache 1 个 周期 2% 
二 级 Cache 8 个 周期 5% 
DRAM 20 个 周期 0.1% 
磁盘 10ms 


计算 平均 存储 器 访问 时 间 。 假 定 二 级 Cache 和 DRAM 可 以 与 一 级 Cache 并 行 访问 。 

1.44 某 16 位 CPU 的 Cache 有 32 块 ， 每 块 16B。CPU 访问 一 个 字 节 的 十 进 制 地 址 为 3210。 这 将 导致 
失效 ， 调 人 新 块 。 该 块 位 于 Cache 中 的 什么 位 置 ? 

1.45 某 计 算 机 具有 256B 的 地 址 空间 和 两 路 32B 的 组 相 联 Cache。 计 算 机 字 的 大 小 是 一 个 字 节 ， 每 个 
Cache 块 包含 4 个 字 节 ， 每 个 Cache 有 4 块 。 如 果 Cache 最 初 是 空 的 ， 按 照 如 下 十 六 进 制 地 址 序 
列 读 取 ， 显 示 相 应 的 命中 和 失效 的 情况 。 
48, 0C, 48, 4C, 5C, 3A, 20, 21, 22, 24, 81, 49, 30, 34, 27, 3E, 24, 28, 2C, 40 

1.46 人 们 总 是 在 寻找 更 有 效 的 Cache 机 制 ， 特 别 是 减少 失效 开销 的 方法 〈 例 如 ， 使 用 Annex Cache 或 
Victim Cache) 。 某 个 学 生 提 出 下 面 的 建议 。 并 非 所 有 数据 都 相同 。 有 些 数 据 使 用 比 别 的 更 频繁 ， 
特别 是 数值 小 的 数 。 所 以 为 什么 不 这 样 安排 Cache: 当 有 两 个 候选 位 置 的 块 可 能 被 替换 时 ， 首 先 


48 


1.47 


1.48 
1.49 


1.53 
1.54 
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把 数值 大 的 块 替 换 出 去 ? 这 种 方法 是 否 可 行 ? 

计算 机 Cache 的 命中 率 为 95%， 每 块 为 4 个 32 位 的 字 。 处 理 器 平均 访问 Cache 的 频率 为 1 亿 次 /s。 
20% 的 CPU 操作 为 load/store 操作 (其 中 读 和 写 操作 分 别 占 70% Al 30%). Cache 使 用 写 直 达 机 
制 ， 在 写 失效 时 会 替换 一 个 块 。 在 此 情况 下 ，32 位 CPU- 存储 器 总 线 可 使 用 的 带宽 是 多 少 ? 

重 做 题 1.47。 此 时 Cache 使 用 写 回 方式 ，Cache 中 平均 25% 的 块 为 脏 块 (已 被 修改 )。 

计算 机 的 存储 器 容量 为 256 个 字 ，Cache 容量 为 16 个 字 。 按 照 以 下 地 址 顺序 读数 据 : 

0, 1, 2, 3, 4, 5, 10, 13, 16, 19, 21, 4, 8, 12, 30, 40, 41, 42, 35, 1, 3, 13 

假设 所 有 Cache 块 最 初 都 是 无 效 的 ， 指 出 Cache 是 如 何 访问 的 。 针 对 以 下 几 种 Cache; 为 每 次 访 
间 做 出 标记 : 命中 、 容 量 失效 、 强 制 失效 或 者 冲突 失效 。 

a. 全 相 联 Cache 

b. 两 路 组 相 联 Cache 

c. 直接 映射 Cache 

某 系统 的 存储 器 访问 时 间 为 50ns, Cache 访问 时 间 为 2ns。 指 令 执行 时 间 为 4ns (不 包括 存储 器 访 
E), 平均 每 条 指令 需要 0.25 次 存储 器 访问 。 如 果 命 中 率 是 0.90, 指令 的 平均 时 间 是 多 少 ? 

某 计 算 机 具有 24 位 地 址 总 线 ， 存 储 器 容量 为 1 6MB，Cache 容量 为 64KB。 字 长 为 两 个 字 节 。 

a. 块 容量 为 32 个 字 的 直接 映射 Cache 的 地 址 格式 是 什么 ? 

b. 块 容量 为 32 个 字 的 全 相 联 Cache 的 地 址 格式 是 什么 ? 

c. 决 容量 为 32 个 字 的 四 路 组 相 联 Cache 的 地 址 格式 是 什么 ? 

某 计算 机 的 存储 器 访问 时 间 为 38ns BAER Cache, 为 其 添加 一 个 访问 时 间 为 10ns HY Cache. 
计算 机 的 运行 速度 提高 了 90%. 试 估计 其 命中 率 是 多 少 。 

为 什么 二 级 Cache 的 命中 率 通常 低 于 一 级 Cache 的 命中 率 ? 

某 系统 一 级 Cache 的 命中 率 为 87% (命中 需要 1 个 周期 )。 二 级 Cache Wt PAH 90%, 访问 时 
间 为 10 个 周期 。 主 存储 器 的 访问 时 间 为 200 个 周期 。 平 均 访 问 时 间 是 多 少 ? 
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“记忆 才 是 我 们 真正 拥有 的 。” 


—Elias Lieberman 


“ 逝 者 活 在 人 们 的 记忆 里 。” 





Cicero 


“虽然 太阳 系 以 每 小 时 四 万 三 千 英里 8 的 速度 向 武 仙 座 球状 星团 M13 靠近 ,但 仍 有 些 人 
坚持 不 承认 这 个 过 程 。” 
一 一 Kurt Vonnegut， 泰 坦 的 警报 
“计算 机 应 该 由 玻璃 构成 ， 因 为 它 到 处 都 是 瓶颈 。 
—Alan Clements, 2001.03 


“在 这 个 世界 上 ， 我 们 身 处 何 地 并 不 重要 ， 我 们 朝 着 什么 方向 前 行 才 重要 。” 





——Oliver Wendell Holmes 
“瞄准 是 不 够 的 ， 你 必须 命中 。” 
德国 谚语 


“计算 机 硬件 发 展 十 分 迅速 。 人 类 有 史 以 来 没有 其 他 技术 能 够 在 .30 年 中 获得 6 个 数 
量 级 的 性 能 一 价格 收益 。” 





Fred Brooks Jr 


2.1 简介 


本 章 将 介绍 的 计算 机 存储 器 和 JIO 系统 是 其 主 存储 器 (main memory) 和 直接 访问 存储 
器 (immediate access store)。 从 许多 方面 看 ， 这 是 计算 机 最 乏味 的 部 分 ， 其 作用 就 是 负责 为 
处 理 器 芯片 存储 数据 。 存 储 器 似乎 没有 什么 可 以 炫 瘤 的 ， 从 来 没有 听 到 电脑 爱好 者 像 谈 论 超 
频 或 多 处 理 器 那样 兴奋 地 谈论 它 。 简 而 言 之 ， 主 存储 器 保存 了 一 些 数 据 直 到 Cache 需要 这 
些 数据 或 者 关闭 了 计算 机 电源 。 但 是 ， 本 章 将 要 介绍 一 些 多 年 来 在 存储 技术 上 取得 的 显著 进 
步 。 将 研究 那些 出 现 和 已 克服 的 问题 ， 并 介绍 一 些 正在 研发 的 新 技术 和 物理 器 件 。 

在 这 一 章 中 ， 将 介绍 直接 访问 存储 器 的 工作 原理 ， 静 态 (static) 和 动态 (dynamic) 存储 
器 之 间 的 差异 ; BAL (volatile) 和 非 易 失 性 .( nonvolatile) 存储 器 之 间 的 差异 。 此 外 还 介 
绍 一 些 开始 在 存储 系统 中 发 挥 重 要 作用 的 新 技术 。 本 章 还 将 讨论 包括 存储 设备 特点 在 内 的 存 
储 系统 设计 者 必须 考虑 的 问题 。 本 书 的 大 多 数 读 者 都 不 可 能 设计 一 个 CPU，, {AAI MEA Aik 
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入 式 计算 机 或 类 似 装置 设计 一 个 存储 系统 。 从 计算 机 摄像 头 到 手机 这 样 的 数字 系统 ， 其 存储 
系统 往往 由 现成 的 组 件 构 成 。 










i a (DRAM). ae (dynamic) arara 
英语 中 动态 一 词 通常 表示 性 能 提升 是 正面 的 ， 甚 至 是 积极 的 。 然 而 ， 在 DRAM 
含义 正好 相反 。 数 据 是 以 电荷 的 形式 存储 的 ， 在 几 毫 秒 内 就 会 泄漏 光 。 RJE 
M 毫秒 内 就 会 失去 其 保存 的 数据 。 要 想 在 DRAM 中 保存 数据 ， 只 有 在 其 
断 地 读 取 它 然后 再 把 它 写 回 。 Het AAAS 1H (EA DRAM 
”应 该 表示 为 滴漏 《drippy)。) | 


原理 上 ， 计 算 机 存储 器 是 最 容易 理解 的 部 件 ; 它 是 保存 程序 和 数据 的 地 方 。 在 实践 中 ， 
存储 系统 总 由 从 DRAM 到 硬盘 这 样 的 各 种 设备 构成 ， 这 些 设备 又 是 由 多 种 技术 制造 的 。 事 
实 上 ， 存 储 设备 性 能 的 差异 比 计算 机 系统 中 的 其 他 部 件 都 要 大 。 存 储 部 件 可 能 保持 几 个 字 或 
JLA GB 的 数据 ; 其 读 取 时 间 最 短 为 lns 最 长 为 几 秒 ; 其 价格 可 能 从 几 美 分 到 一 千 美 元 。 

因为 存储 器 涉及 的 内 容 很 多 ， 涵 盖 不 同 的 存储 技术 , 本 书 将 存储 部 分 分 为 两 章 。 本 章 
着 眼 于 程序 运行 时 所 在 的 直接 访问 存储 器 (immediate access store) 或 主 存储 器 (primary 
storage) 。 下 一 章 将 介绍 用 来 保存 当前 没有 
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storage) 系统 。 虽然 现 在 有 的 二 级 存储 器 采用 g 1000 
了 固态 硬盘 ， 一 般 情况 下 ， 主 存储 器 采用 半 导 È 10 
体 技术 、 而 二 级 存储 采用 磁性 或 光学 技术 实 * 10 DRAM 


现 ° on 1990 2000 
存储 器 的 性 能 提升 迅速 ， 在 过 去 的 20 年 年 份 
中 每 年 约 提升 7%， 如 图 2-1 所 示 。 另 一 方面 ， 图 2-1 20 年 来 存储 器 技术 的 发 展 
处 理 器 的 性 能 提升 更 了 不 起 ， 每 年 提高 60% ， 
比 存储 器 性 能 提升 快 很 多 ， 这 使 得 存储 器 系统 成 为 现代 处 理 器 的 一 大 瓶颈 。 
本 章 将 介绍 静态 和 动态 半导体 存储 器 的 工作 原理 ， 以 及 它们 是 如 何 与 处 理 器 连接 的 。 特 
别 是 将 介绍 存储 器 的 时 序 ， 给 出 数据 传送 过 程 中 操作 的 序列 。 这 部 分 内 容 将 帮助 读者 理解 
在 第 4 章 中 将 介绍 的 一 些 概念 ， 第 4 章 主 要 介绍 输入 /输出 技术 。 本 章 有 一 节 是 专门 介绍 
DRAM 的 ， 它 具 有 复杂 的 接口 要 求 ， 近 年 来 已 经 出 现 了 几 种 形式 的 DRAM。 


2.1.1 存储 系统 的 原理 和 参数 


人 们 期 望 存储 设备 能 够 完成 其 预期 工作 一 一 记 住 数据 。 可 以 利用 任何 一 种 材料 来 实现 存 
储 器 ， 只 要 该 材料 的 某 种 性 质 可 以 改变 ， 而 后 又 可 以 检测 这 种 变化 即 可 。 大 多 数 计算 机 教材 
认为 ， 第 一 个 存储 系统 是 Hollerith 发 明 的 制 表 机 上 的 打 孔 卡片 或 者 是 Jacquard 织 布 机 上 的 
木 制 卡 。 当 然 ， 从 广义 上 讲 ， 所 有 包括 从 埃及 象形 文字 到 纸 笔 系 统 等 在 内 的 各 种 书写 系统 都 
是 存储 系统 。 

可 以 用 来 存储 数据 的 物理 性 质 的 范围 相当 广泛 。 虽 然 人 们 都 听 到 过 山谷 的 回声 ， 但 很 少 
有 人 会 想到 使 用 回声 作为 存储 系统 的 基础 。20 世纪 40 年 代 后 期 ， 人 们 利用 声波 在 水 银 管内 
的 传播 来 存储 数据 (水 银 延 迟 线 存储 器 ) 。 在 该 管 的 一 端 ， 以 一 系列 超声 波 脉冲 的 形式 将 数 
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据 传 输 到 管 中 (声音 在 水 银 中 的 传输 速度 为 1450m/s)。 当 声音 到 达 管 子 的 男 一 端 ， 它 由 声 电 
转换 器 接收 并 放大 ， 并 反馈 到 管子 的 前 一 端 。 这 是 一 种 动态 存储 器 ， 因 为 数据 总 是 以 物理 运 
动 的 形式 存在 。 即 使 在 今天 ， 玻璃 延迟 线 仍然 用 在 一 些 电 视 信 号 处 理 中 ， 用 来 将 信号 延迟 一 
段 固定 的 时 间 。 

20 世纪 50 年代 至 70 年代， 数据 被 存储 在 由 铁 氧 体 磁 芯 ( ferrite core) 构成 的 小 珠子 
(或 环 ) 的 磁场 中 (因此 计算 机 文献 中 通常 将 其 称 为 磁 芯 存储 器 )。 今 天 的 硬盘 仍然 使 用 相同 
的 磁性 质 来 存储 数据 。 正 是 由 于 其 重要 性 ， 本 书 将 在 下 一 章 详细 讨论 磁 记 录 方 式 。 

从 20 世 纪 70 年 代 中 期 开始 ， 半 导体 存储 器 已 经 成 为 主 存 储 器 的 标准 形式 ， 即 静 
AS RAM (SRAM) 或 动态 RAM-( DRAM)。 今 天 只 有 小 型 媒 入 式 系 统 使 用 静态 RAM， 而 
PC 使 用 大 约 2 一 48GB 的 DRAM。 如 果 DRAM 是 本 章 的 主题 (theme) 的 话 ， 那 么 变化 
(variation) 则 是 由 一些 半导体 存储 器 的 新 形式 ， 如 铁 电 (ferroelectric) 半导体 存储 器 ， 它 用 
晶体 中 原子 的 位 置 来 存储 数据 ; 或 者 双向 开关 (ovonic) Fiir, CAAA. (chalcogenide) 
玻璃 在 非 晶 态 (amorphous) 和 晶 态 (polycrystalline) 之 间 的 转换 来 存储 数据 。 下 面 引 入 一 些 
词汇 来 对 存储 器 系统 和 技术 进行 描述 。 

1. :随机 访问 和 顺序 访问 存储 器 

计算 机 所 使 用 的 不 同 存储 技术 之 间 的 根本 区 别 在 于 数据 的 访问 方式 : 直接 (directly) 
访问 或 顺序 (sequentially) 访问 。 可 以 直接 访问 的 存储 器 被 称 为 随机 访问 存储 器 (random 
access memory, RAM)， 这 是 由 于 可 以 随机 地 访问 任何 数据 元 素 ， 且 所 花费 的 时 间 是 固定 的 ， 
与 数据 的 物理 位 置 无 关 。 这 种 存储 器 也 被 称 为 直接 访问 存储 器 (immediate access memory, 
IAS)。 当 然 ， 这 些 存储 器 肯定 不 是 立即 访问 的 一 一 没有 哪 种 存储 器 可 以 立即 得 到 访问 结果 ， 
只 是 它们 比 其 他 类 型 存储 器 的 速度 要 快 罢了 。 

顺序 访问 存储 器 需要 依次 访问 每 个 存储 单元 直到 找到 所 需 的 元 素 。 顺 序 访问 存储 器 的 例 
子 是 磁带 存储 器 ， 需 要 一 直 读 磁带 直到 找到 所 要 的 数据 。 前 面 提 到 的 水 银 延 迟 线 (acoustic 
mercury delay line) 存储 器 就 是 顺序 访问 存储 器 。 随 机 访问 存储 器 比 顺序 访问 存储 器 要 快 ， 
但 它们 也 更 贵 。 大 多 数 半导体 存储 器 如 DRAM .或 闪存 都 是 随机 访问 的 。 而 移 位 寄存 器 是 一 
种 顺序 访问 存储 器 。 





人 们 常 说 存储 器 的 违 度 或 者 说 其 是 如 何 快 或 如 何 慢 。 这 些 术 语 指 的 是 需要 多 长 的 时 间 来 
访问 数据 。 存 储 器 的 关键 参数 为 访问 时 间 teco 

2. 易 失 性 和 非 易 失 性 存储 器 

在 理想 的 存储 器 中 ， 数 据 将 一 直 保 持 不 变 直到 修改 它 。 这 种 存储 器 被 称 为 非 易 失 性 
(nonvolatile) 存储 器 。 例 如 ， 写 数据 到 硬盘 ， 这 些 数据 将 一 直 保存 在 硬盘 上 。 有 些 存储 器 
技术 只 在 加 电 的 时 候 才能 保留 数据 ， 拔 掉 电 源 插头 数据 就 丢失 了 。 这 些 存储 器 被 称 为 易 类 
性 (volatile) 存储 器 ， 因 为 断 电 后 数据 将 丢失 。 大 多 数 PC 和 工作 站 的 主 存 都 由 易 失 性 的 
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DRAM 构成 。 如 果 采 用 非 易 失 性 存储 器 ,就 没有 必要 在 每 次 打开 电源 开关 后 重新 启动 计算 
机 (即将 操作 系统 从 非 易 失 性 的 磁盘 存储 器 装载 到 计算 机 的 易 失 性 存储 器 中 )。 稍 后 将 介绍 
一 类 非 易 失 性 存储 器 一 一 闪存 (flash memory)， 它 是 目前 的 一 种 主流 技术 ， 是 非 易 失 性 存储 
器 的 新 形式 。 

3. 读 / 写 和 只 读 存 储 器 

如 果 可 以 向 存储 器 写 或 者 从 存储 器 读数 据 ， 而 且 可 以 完成 的 读 操作 与 写 操作 的 次 数 相 
近 ， 这 种 存储 器 就 是 读 / 写 (read/write) 存储 器 。 计 算 机 的 主 存 当然 是 由 读 / 写 存储 器 组 成 。 
如 果 可 以 很 容易 地 读 存储 器 ， 但 其 内 容 不 能 修改 ， 则 为 只 读 (read-only) 存储 器 。 只 读 存储 
器 总 是 非 易 失 性 存储 器 。 

HA, 没有 真正 的 只 读 存储 器 。 如 果 有 ， 就 不 可 能 首先 把 数据 放大 其 中 完全 意义 上 的 
只 读 存 储 器 正如 王 水 的 地 位 一 样 ,除非 被 分 解 , :否则 没有 任何 容器 能 够 容纳 它 。 在 掩 模 编程 
( mask-programmed) ROM 被 生产 的 时 候 数据 就 完成 了 加 载 ， 因 为 每 个 存储 单元 的 物理 结构 
决定 了 它 保 存 的 是 1 还 是 0。 掩 模 编程 ROM 价格 便宜 ， 但 以 后 不 能 修改 。 它 曾经 用 来 保存 
引导 程序 、 操 作 系 统 以 及 BIOS。 今 天 它 已 过 时 ， 被 闪存 奉 代 了 -。 

实际 的 只 读 存 储 器 更 应 该 描述 为 大 部 时 间 为 读 (read-mostly) 的 存储 器 ,， 它 可 以 进行 
有 限 次 数 的 修改 。 此 外 ， 它 的 写 操作 要 比 读 操作 更 复杂 且 更 缓慢 。 这 类 存储 器 的 例子 包括 
EPROM, EEPROM 和 闪存 。EPROM 表示 电 可 编程 只 读 存储 器 (electronically programmable 
read-only memory), EEPROM 表示 可 擦 除 和 电 可 编程 只 读 存 储 器 (erasable and electronically 
programmable read-only memory)。 后 文 将 更 详细 地 介绍 这 些 技术 。 

4. 静态 和 动态 存储 器 

随机 访问 、 读 写 以 及 易 失 性 存储 器 可 以 分 为 两 类 : 静态 (static) 和 动态 (dynamic). € 
是 通过 半导体 存储 单元 的 结构 及 其 性 质 来 进行 分 类 的 。 静 态 存储 器 利用 交叉 耦合 的 晶体 管 来 
构造 一 个 RS 触发 器 ， 用 触发 器 的 状态 来 存储 数据 。 动 态 存储 器 (DRAM) 采用 半导体 技术 
将 数据 表示 为 存储 在 电容 中 的 电荷 。 相 比 于 动态 存储 器 ， 静 态 存 储 器 的 速度 较 快 、 价 格 较 
昂贵 、 芯 片 密度 〈 位 /芯片 ) 较 低 。 动 态 存储 器 更 便宜 ， 但 相 比 静态 存储 器 在 实际 电路 中 使 
用 更 难 。 今 天 这 种 情况 在 逐渐 好 转 。 如 今 ， 通 过 CPU, EAR HA DRAM 自己 来 完成 对 
DRAM 的 控制 。20 世纪 80 年 代 ， 在 计算 机 中 实现 DRAM 控制 器 是 一 项 艰巨 的 任务 。 





Rk, ANARAN 16+81212-28。 ， ts 
ASE ALG TBARS HE LAE BEG ER, RECANE (refreshing) 操作 重 


日 我 想 说 的 是 ， ara gical lai 然而 ， 在 我 看 来 ， 易 失 性 ROM 至 少 有 一 个 重要 的 应 用 。 读 
者 你 能 想到 吗 ? 
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Bs 动态 存储 器 中 读 与 写 的 访问 时 间 不 同 ， 典 型 的 DRAM 并 不 能 真正 地 随机 访问 ,这 是 因 
为 相 邻 存储 单元 要 比 随机 选择 单元 的 访问 速度 更 快 。 

HF DRAM 组 成 了 大 多 数 PC 和 工作 站 的 存储 器 ，DRAM 的 性 能 和 特点 对 计算 机 的 整 
体 性 能 有 重要 影响 。 后 文 将 详细 介绍 DRAM. 

5. 存储 器 参数 

存储 器 的 最 小 单元 就 是 存储 一 位 的 存储 位 元 (memory cell). 半导体 存储 器 被 组 织 为 一 
个 n 行 m 列 的 数组 ; 即 它 含有 nxm 个 位 元 。 存 储 器 的 宽度 (width)m， 就 是 存储 器 中 每 
个 字 包 含 的 比特 (位) 数 。 当 执行 读 或 写 操作 时 ， 一 个 字 的 所 有 m 位 同时 进行 相同 的 操作 。 
存储 器 的 长 度 (length) n, 定义 为 地 址 的 数目 ( 即 存储 器 使 用 1og;, 元 位 地 址 线 来 访问 元 个 
位 置 。 

存储 部 件 的 宽度 并 不 一 定 与 计算 机 中 总 线 或 基本 数据 单元 的 宽度 相同 。 例 如 ， 计 算 机 可 
能 具有 64 位 的 数据 总 线 ， 但 使 用 4 位 宽度 的 存储 部 件 。 因 为 每 个 存储 部 件 只 提供 4 位 数据 ， 
这 就 需要 64/4=16 个 存储 部 件 并 排 工作 以 满足 64 位 数据 总 线 的 需求 。 如 果 每 个 4 位 存储 部 
件 具 有 4M 个 可 寻 址 位 置 ， 则 存储 部 件 的 容量 为 4b x 4M=16Mb=2”b=2MB ， 整 个 存储 器 的 
容量 为 16 H x 16Mb=2"*b=32MB. 

图 2-2 说 明了 -3 种 宽度 之 间 的 关系 。 该 CPU 具有 64 位 的 寄存 器 ， 因 此 被 称 为 64 位 机 ; 
即 它 是 64 位 体系 结构 的 。CPU 和 存储 器 之 间 的 总 线 为 32 位 宽 ，64 位 的 数据 元 素 必须 连续 
两 次 通过 总 线 操作 从 存储 器 中 取出 。 此 时 可 以 说 ，64 位 体系 结构 《architecture) 用 32 位 组 
织 形 式 (organization) 实现 。 该 存储 器 阵列 由 4 个 8 位 芯片 构成 。 这 些 忌 片 在 每 个 读 周期 贡 
献 8 位 数据 ， 即 芯片 是 并 行 访问 的 。 

64 位 寄存 器 
8 位 存储 器 芯片 


64 位 CPU 32 位 存储 器 
3 (每 个 保存 32 位 eee 


中 的 8 位 ) 


32 位 总 线 


图 2-2 存储 器 芯片 宽度 、 存 储 器 宽度 和 总 线 宽度 


存储 器 的 主要 时 间 参 数 是 其 读 访 问 时 间 (read access time)、 写 访问 时 间 ( write access 
time) 和 周期 时 间 (cycle time)s 读 访问 时 间 就 是 访问 存储 器 位 置 并 获取 其 内 容 的 时 间 。 写 
访问 时 间 就 是 将 数据 写 到 存储 设备 中 的 时 间 。 油 期 时 间 是 两 个 连续 的 存储 器 访问 之 间 的 最 小 
间隔 时 间 。 

理想 情况 下 ， 存 储 器 的 读 。 写 和 周期 时 间 都 应 该 相同 ， 这 在 半导体 静态 RAM 中 是 正 
确 的 。 有 些 存储 器 〈 例 如 ，DRAM) 的 周期 时 间 比 读 或 写 访问 时 间 要 长 ， 这 是 因为 在 连续 访 
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问 之 间 需 要 完成 某 些 内 部 操作 。 前 文 已 经 指出 ， 大 部 时 间 为 读 的 存储 器 ， 如 Flash EPROM, 
写 访 问 时 间 要 比 读 访问 时 间 长 得 多 。 

一 个 特别 重要 的 存储 器 参数 是 功 耗 (power consumption), 半导体 读 / 写 存储 器 需要 能 
量 来 操作 和 存储 数据 。 功 耗 对 于 由 电池 供电 的 便携 式 设备 设计 来 说 是 十 分 重要 的 ; 这 是 当今 
泛 在 计算 和 个 人 计算 关注 的 一 个 重要 问题 。 

”存储 设备 (或 任意 其 他 部 件 ) 消耗 的 能 量 最 终 表 现 为 热量 ， 必 须 被 扩散 到 周围 的 环境 中 。 
由 于 散热 量 决定 了 存储 器 (或 CPU) 的 操作 温度 ， 因 此 散热 非常 重要 。 当 某 个 设备 对 象 的 温 
度 高 于 环境 温度 ， 散 热量 与 该 设备 的 散热 面积 、 散 热 表 面 的 效率 、 环 境 温 度 和 设备 温度 之 间 
的 差 值 等 有 关 。 某 设备 的 散热 量 Pissows 由 下 式 给 出 : 

P insipas—K*A:(tavioo— famibient) 表 2-1 半导体 存储 器 的 特性 

其 中 : KK 为 常数 ，4 为 散热 面 面 积 。 

因为 部 件 失效 的 概率 是 温度 的 指 
数 函 数 (每 增加 15% ， 故 障 率 增 加 
一 倍 ),， 因 此 功 耗 应 尽 可 能 地 小 。 具 
有 较 大 散热 量 的 芯片 ， 如 处 理 器 ， 需 AR 
要 配备 散热 片 (heat sink) 来 增加 其 。 访问 时 间 
表面 积 ; 如 果 散热 面积 4 增加 了 ， 散 ”. 记 用 场合 
Pe BEAU BE ZS (taeyice—tambient) 就 可 以 减 小 。 

表 2-1 总 结 了 本 章 中 讨论 的 几 种 存储 设备 的 典型 特性 。 


2.1.2 ”存储 层次 


虽然 已 经 在 第 1 章 中 介绍 了 存储 层次 (memory hierarchy)， 图 2-3 提醒 人 们 ， 该 概念 是 
理解 计算 机 存储 系统 组 织 的 关键 。 本 章 讨 论 随 机 访问 存储 器 (random access memory)， 包 括 
项 态 和 动态 存储 器 。 在 介绍 读 / 写 存 储 器 (read/write memory) 后 ， 将 介绍 包括 闪存 在 内 的 
大 部 分 时 间 为 读 (read-mostly) 的 存储 器 系列 。 如 果 说 低 成 本 、 高 速 随机 访问 存储 器 将 改进 
计算 机 的 性 能 ,使 它们 更 快 、 更 能 实时 处 理 视频 信息 ， 那 么 闪存 的 应 用 已 经 带 来 了 从 手持 设 
备 到 MP3 播放 器 等 新 一 代 个 人 数字 系统 。 


更 快 













sg 7 We ma 
BIOS， 数 字 播放 器 ，MP3 






三 级 存储 器 / 磁带 


海量 存储 器 、 互 联网 及 云 存储 
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图 2-3 存储 层次 
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2.2 主 存储 器 


这 一 节 将 介绍 直接 访问 存储 器 (immediate access store) 或 者 主 存储 器 (primary memory). 
没有 低 成 本 、 高 速 的 存储 器 ， 实 现 复 杂 的 操作 系统 和 应 用 (例如 Photoshop) 是 十 分 困难 的 。 
本 节 首 先 介绍 静态 存储 器 (SRAM), AA EEDA Aa (DRAM) 之 前 出 现 且 比 DRAM 
更 容易 理解 。 实 际 上 ，Cache 存储 器 通常 由 SRAM 实现 。 


2.2.1 SRAM 


2-4 说 明了 SRAM 概念 上 是 如 何 工作 的 。 两 个 反 向 器 端 端 门 1 
相 联 构成 一 个 环 。 门 1 的 输入 是 4， 其 输出 B= 4， 这 又 是 门 2 的 
AS 门 2 的 输出 是 4X4, 其 中 4= B= 4=4， 这 也 是 门 1 的 输入 。 了 B 
门 1 的 输入 是 由 门 1 的 输入 经 过 反馈 产生 的 。 这 是 一 个 自主 维持 
存储 器 (self-sustaining memory)。 无 论 初始 给 门 1 何 种 输入 ， 其 2 
反馈 都 会 使 这 种 状态 得 到 维持 。 Ba ea aR 
图 2-5 显示 了 如 何 将 图 2-4 中 的 两 个 交叉 耦合 的 反 向 器 变 成 实际 的 静态 存储 位 元 。 作 为 
开关 的 两 个 晶体 管 9 连 接 到 反 向 器 电路 的 左边 和 右边 ， 用 于 访问 存储 单元 (右边 的 阴影 插图 
显示 了 晶体 管 有 3 个 端子 ; 在 控制 栅 极 的 信号 电 平 决定 了 另外 两 极 之 间 的 路 径 是 打开 还 是 关 
闭 )。 当 读 / 写 信号 线 是 低 电 平 ， 这 两 个 晶体 管 都 处 于 打开 状态 ， 数 据 信 号 线 Data 和 Data 都 
没有 被 反 向 器 驱动 ( 即 被 控制 )。 
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读 / 写 信号 





Data Data 


2-5 SRAM 存储 位 元 的 操作 


数据 写 和 人 位 元 时 ,将 要 写 的 一 位 数据 及 其 取 反 值 分 别 放 在 Data 和 Data 信 号 线 上 ， 然 后 
发 出 读 / 写 信号 。 反 向 器 节点 4 和 B 被 修改 为 所 期 望 的 值 ， 当 读 / 写 信号 为 低 电 平时 保持 写 
入 的 数据 。 当 进行 读 操作 时 ， 首 先 发 出 读 / 写 信号 ,使 反 向 器 的 输出 然 
后 读 取 4 节点 的 电 平 信号 即 可 。 
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O 这 里 没有 详细 解释 晶体 管 的 操作 。 只 要 将 其 想象 为 图 2-5 中 插图 所 示 的 那样 一 个 具有 ;3 个 端子 /( 连 接线 ) 的 
装置 即 可 。 其 中 两 端 通过 开关 连接 ; 即 ， 两 端 间 可 以 存在 也 可 以 不 存在 电路 。 第 三 端 为 控制 端 ， 用 来 改变 开 
关 的 状态 。 若 端子 为 4、B 和 C (其 中 C 为 控制 端 )， 如果 C 一 1, WA BAR; 否则 4 与 B 断 开 。 
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并 不 重要 了 。 SY an AR AA 
这 里 讨论 SRAM 是 因为 它 ( 倒 如 ， 对 于 小 型 或 低 功 耗 系统 来 说 ) 仍然 是 重要 的 ， a 

| 对 其 时 序 特性 的 介绍 可 以 作为 介绍 DRAM 更 复杂 行为 的 基础 。 此 外 ， SE MNT 
器 的 接口 与 其 他 存储 器 映射 外 设 (将 在 第 4 章 中 讨论 ) 有 很 大 不 同 。 g 4 
然而 ， 由 于 静态 存储 器 非常 快 ， 它 仍然 可 以 用 于 制造 Cache 存储 器 。 时 在 1981 

年 ， 实验 室 中 就 观测 到 了 低 于 0.6ns 的 SRAM orn RT 

非 硅 )。 MARS | TS 


9 AE BE A PRA IC, LAE RRS TEAR 6 ARNET 
储 一 位 数据 。 实 际 的 静态 存储 器 为 m xn 的 位 元 阵列 。 访 问 位 元 时 需要 指定 其 行 和 列 地 址 。 
因此 ,一 个 位 的 静态 存储 单元 需要 6n 个 晶体 管 加 上 用 于 行列 地 址 解码 以 及 执行 各 种 信号 
控制 与 保持 操作 所 需 的 晶体 管 。 

有 些 静 态 存 储 器 每 个 位 元 只 需 使 用 4 个 晶体 管 。 无 论 怎样 ,，n 位 静态 存储 器 位 元 需要 4n 
或 6n 个 晶体 管 。 而 动态 存储 位 元 只 需要 一 个 晶体 管 ， 这 意味 着 动态 存储 器 的 密度 至 少 可 以 
达到 静态 存储 器 的 4 倍 。 图 2-6 给 出 了 由 :6 个 晶体 管 构 成 的 静态 存储 位 元 的 电路 图 。 图 中 用 
插图 的 形式 将 DRAM 位 元 与 其 进行 对 比 。 静态 存储 器 的 速度 比 动态 存储 器 的 速度 要 快 。 


每 个 存储 位 元 6 个 晶体 管 





位 元 选中 信号 
Data Data 
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图 2-6 ”由 6 个 晶体 管 构成 的 SRAM 存储 位 元 与 DRAM 对 比 


半导体 技术 的 进步 总 是 在 继续 。; 2001 年 ,日 本 富士 通 实验 室 的 研究 人 员 公 布 了 一 款 由 
SRM LD (与 常见 的 半导体 材料 硅 对 比 是 一 种 很 专业 的 物质 ) 构成 的 单 晶体 管 静态 存储 位 
元 的 设计 ， 可 以 工作 在 77K (-196 )。 这 样 的 温度 对 当前 的 实际 应 用 来 说 都 太 低 。 它 可 以 
通过 量子 隧道 (quantum tunneling) 效应 来 存储 数据 。 ee 如 纳米 管 ， 可 能 是 未 
来 高 密度 、 低 功 耗 存 储 器 的 可 能 竞争 者 。 ; 

一 种 实用 的 半导体 SRAM Gt 芯片 由 独立 的 存储 位 元 阵列 构成 图 :2:7 给 出 了 一 个 16 位 的 
heise msl nde cae vue eon iain gee a eae 
列 地 址 : 三 三 四 译 码 器 对 两 位 行 地 址 进行 译 码 后 选中 一 行 。 

同时 ， 列 译 码 器 选中 4 列 之 一 。 每 行 和 每 列 的 交叉 处 是 存储 位 元 ， 根 据 Write 信 号 的 状 
态 进入 读 或 写 周 期 。 这 个 阵列 说 明 存储 器 操作 是 以 前 面 介绍 的 逻辑 部 件 的 形式 进行 的 。 存 储 
阵列 的 实际 实现 将 使 用 图 2-6 中 所 示 的 存储 位 元 。 
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数据 输入 /输出 
图 2-7 SRAM 阵列 的 组 织 






ef: AAR RE 






当 设备 断 电 后 ， 
_ 该 设备 真有 所 


A ee OO SRS 
His i 






1. SRAM 存储 系统 


下 面 来 看 看 如 何 使 用 静态 存储 器 。RAM 芯片 被 组 织 成 一 位 宽 、 半 字 节 宽 (4 位 )、 字 
节 宽 (8 位 ) 或 16 位 宽 的 设备 。 图 2-8 给 出 了 一 个 容量 为 512Kb 的 SRAM， 它 有 64K F, 
每 个 字 8 位 。 它 有 16 条 地 址 线 A,~ Aly， 可 以 选择 2°=64K 个 位 置 ， 它 还 有 8 条 数据 线 


Dy ~ D; 可 以 在 一 个 读 周 期 内 将 8 位 数据 交 给 处 理 器 ， 也 可 以 在 一 个 写 周 期 内 从 处 理 器 接收 
8 位 数据 。 
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eer 


EE 
| 地 址 线 Aw ~ Ais JEEN 
| 7 . 

CS 信号 为 低 电 平 ， ee 
fora, ay RW 在 读 风 其 
以 参加 读 写 访问 下 为 高 电 让 ， 在 

写 周期 为 低 电 平 
图 2-8 SRAM 芯片 


访问 SRAM 之 前 需要 在 地 址 总 线 土 给 出 一 个 地 址 ， 由 一 系列 0 和 上 工 的 组 合 定义 访问 位 
置 ， 然 后 要 么 在 读 周期 中 将 数据 交 给 数据 总 线 ， 要么 在 写 周 期 中 从 数据 总 线 读 取 数据 。 

SRAM 的 操作 通过 两 个 信号 R/W 和 CS 控制 。R/W 决 定 了 芯片 是 参加 读 周 期 (R/W =) 
还 是 写 周 期 (R/W =0 ) 的 操作 。 低 电 平 有 效 的 片 选 信号 CS 确定 该 芯片 是 参加 读 或 写 访问 ， 
还 是 保持 空闲 状态 。 一 般 情 况 下 ，CS 为 高 电 平 ， 此 时 R/W 信 号 被 忽略 。 当 CS 为 低 电 平时 ， 
芯片 参与 读 还 是 写 操 作 取 决 于 R/W 信 号 。 在 读 周期 中 ，CS 可 以 控制 存储 器 三 态 缓冲 器 的 输 
出 (参见 《计算 机 组 成 原理 》 第 2 章 )。 

图 2-9 给 出 了 SRAM 的 时 序 图 (timing diagram),， 说 明 在 读 操 作 期 间 事件 发 生 的 顺序 。 
时 序 图 表明 ， 为 保证 正确 的 存储 器 操作 ， 信 和 号 必须 保持 的 最 小 时 间 ， 并 指出 活动 从 开始 到 结 
束 之 间 可 能 的 最 大 持续 时 间 。 图 中 带 箭头 的 线 表 示 因 果 系 ; 例如 ，CS 当 在 C 点 变 低 (原因 ) 
使 数据 总 线 驱动 器 在 E 点 被 打开 (结果 )。 


时 间 
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这 些 参数 给 出 了 执行 
动作 的 时 间或 动作 所 
TRM tyu 为 完成 
读 周期 所 需 的 最 小 时 
间 。tcc 为 访问 时 间 ， 
这 是 等 待 数据 所 必须 
花费 的 最 长 时 间 。 tn 
为 当 5S 变 高 时 ,数据 
总 线 变 为 悬浮 (float) 
ATTA. hoa 
后 
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t 
数据 有 效 的 起 点 
图 2-9 SRAM 读 周 期 时 序 


假设 最 初 (图 的 左边 ) CS 为 高 ，R/W 在 整个 操作 期 间 保 持 工 状态 。R/W 在 图 2-9 中 没有 
表示 出 来 。 

在 图 2-9 中 的 4 点 ， 地 址 总 线 通 过 改变 状态 为 当前 读 操作 提供 一 个 有 效 地 址 。 这 种 状态 
的 变化 由 地 址 线 的 交叉 部 分 表示 。 一 旦 地 址 信号 稳定 下 来 ， 片 选 信号 在 C 点 指出 开始 进行 
存储 器 访问 。 由 于 R/W 为 高 电 平 ， 故 为 读 操作 周期 。 
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R/W 为 高 与 CS 为 低 的 效果 导致 存储 器 把 数据 放 到 存储 器 的 数据 总 线 上 二 数据 总 线 结束 
芒 浮 状态 ， 数 据 在 EE 点 开始 出 现在 总 线 上 。 然 而 此 时 数据 仍然 是 无 效 的 ， 因 为 数据 的 访问 时 
间 尚 未 开始 。 

在 五 点 ， 地 址 信号 变 为 有 效 后 ; 经 过 xcc 秒 ， 数 据 可 以 被 处 理 器 读 取 六 在 刀 点 ;处 理 
器 将 CS 变 成 高 电 平 以 完成 读 周期 ， 在 点 G 数 据 总 线 再 次 变 成 高 阻 的 悬浮 状态 。 从 B 点 改变 
地 址 到 数据 在 G 点 发 生变 化 的 时 间 称 为 数据 保持 时 间 (data hold time). 数据 保持 时 间 定 义 
AHH A (Gh) 控制 信号 发 生 改变 后 ， 数 据 总 线 上 数据 的 保持 时 间 s 某 些 系统 需 要 正 的 ( 非 
F) 数据 保持 时 间 以 保证 数据 可 以 被 可 靠 地 获取 。 

2. 写 周期 ; 

图 2-10 给 出 了 一 般 的 SRAM 写 周 期 的 时 序 图 ， 它 比 相应 的 读 周 期 更 复杂 (这 情况 对 所 
有 的 存储 设备 来 说 都 存在 )。 每 个 芯片 的 具体 实现 不 同 ， 但 基本 原理 是 相同 的 。 要 存储 的 数 
据 先 放 到 数据 总 线 上 ， 然 后 CS 和 R/W 变 为 低 电 平 以 启动 写 周期 。 

Ae ae 数据 建立 时 间 

(data setup time) 
指 的 是 数据 在 


来 自 CPU 1 
的 数据 0 





数据 建立 时 间 数据 
保持 时 间 


图 2-10 SRAM 写 周期 时 序 
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图 2-10 中 ， 地 址 总 线 在 4 点 开始 有 效 直 到 写 周 期 在 B 点 结束 。 假 定 CS 在 C 点 变 为 低 电 
平 。 此 时 ，R/W 仍 然 为 高 电 平 ， 数 据 总 线 处 于 悬浮 状态 。 

访问 在 C 点 开始 ， 但 对 RAM 而 言 ， 只 要 R/W 为 高 电 平 就 表示 是 读 周 期 。 因 此 ， 在 点 
G, RAM 开始 用 读 出 的 数据 驱动 数据 总 线 。 当 然 ， 此 时 的 数据 是 无 效 的 , -因为 数据 的 访问 
时 间 尚 未 开始 a 

在 E 点 ， 处 理 器 使 RIW 变 为 低 电 平 表 明 当 前 周期 是 写 周 期 。 存 储 器 终止 已 经 开始 启动 
的 读 周期 ， 并 在 点 五 停止 用 读 出 的 数据 驱动 数据 总 线 。 可 见 ， 存 储 器 在 点 G 和 五 之 间 给 出 
了 假 的 数据 。 系 统 设计 师 必须 保证 ， 此 时 没有 其 他 设备 使 用 总 线 。 

在 点 1， 处 理 器 将 要 保存 的 数据 放 到 数据 总 线 上 。 写 周期 的 关键 点 为 点 ， 此 时 RJ/W 信 
号 的 上 升 沿 表示 开始 捕获 数据 。 数 据 必须 在 R/W 的 上 升 沿 之 前 有 效 ， 并 保持 到 低 电 平 变 为 高 
电 平 之 后 ， 此 段 时 间 为 数据 保持 时 间 (data hold time)。 真 正 SRAM 的 设计 以 CS 或 R/ 克 中 的 
任何 一 个 变 为 高 电 平 来 终止 写 周期 。 

介绍 完了 SRAM， 自 然 就 应 该 介绍 DRAM. 但 是 在 这 之 前 ， 还 应 该 顺便 介绍 影响 所 有 
存储 器 系统 设计 的 两 个 问题 ， 无 论 是 静态 /动态 、 读 写 /只 读 存储 器 。 这 两 个 问题 就 是 字 节 / 
字 控 制 以 及 地 址 译 码 的 使 用 。 
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3: 字 节 / 字 控 制 

20 世纪 70 年 代 ， 微 处 理 器 都 是 按 字 节 宽度 设计 的 ， 数 据 总 线 为 8 位 宽 。 地 址 总 线 为 16 
位 ,使 用 As ~ Ao 这 些 地 址 线 可 以 选 定 2"=64K 个 字 节 。 当 出 现 了 16 位 处 理 器 后 ;情况 变 
得 更 复杂 ,此 时 需要 访问 字 节 和 16 位 的 字 ( 记 住 , 存储 器 是 以 字 节 编 址 的 ;无 论 字 长 是 1 
个 2 个 ,4 个 还 是 多 个 字 节 ; 都 可 以 访问 存储 器 中 的 一 个 字 节 )。 

由 于 微 处 理 器 设计 者 既 希 望 访问 单个 字 节 又 希望 具有 访问 16 位 的 能 力 , 故 他 们 实现 了 
字 节 控制 机 制 允 许 访 问 单个 字 节 或 者 选中 的 字 。 一 种 典型 的 机 制 是 使 用 地 址 总 线 选中 一 个 
16 位 的 字 (或 32 位 或 64 位 )， 然 后 使 用 字 节 控制 线 (byte control line) 选中 该 地 址 处 的 二 
个 或 多 个 字 节 。 图 2-11 给 出 了 一 种 可 能 的 实现 ， 通 过 地 址 线 As ~ Ao 来 选中 [225 个 :16 位 
的 字 。 
i 15 位 地 址 总 线 选 择 25 个 中 的 一 不 16 


位 的 字 。 两 个 选 通 信号 确定 选择 该 地 址 
处 的 低位 、 高 位 还 是 两 个 字 节 







字 节 选择 控制 
(类 似 Aco 的 作用 ) 






[ba ~ Duc tom] eae 


O BRE Do ~ Ds 
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图 2-11 字 节 / 字 控 制 


,地 址 线 Ao 没有 使 用 ， 因 为 每 个 地 址 总 是 选中 两 个 字 节 ; 即 地 址 为 0,2,4,6,8,…,2'”。 两 
个 字 节 选 通信 号 BS, ABS, 控制 选中 字 的 奇数 字 节 还 是 偶数 字 节 ， 或 者 同时 选中 两 个 字 节 
(参见 表 2-2 ) 。 


表 2-2， 存 储 器 中 的 字 节 选择 






— 







选择 高 位 字 节 D; "Y Dis 
选择 两 个 字 节 Do Dis 





eee ark oe 
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000 0000 to “03F FFFF 

0400000 to O7FFFFF = 
0800000 to OBF FFFF 

0C0 0000 to OFF FFFF 

1000000 to 13F FFFF ， 
1400000 to 17FFFFF ， 
1800000 to 1BFFFFF = 
1C0 0000 to 1FFFFFF 


如 果 希 望 定 位 地 址 空间 从 0C0 0000 至 OFF FFFF 这 8MB Hk, 地址 直线 的 最 高 3 
位 将 是 011。 PP A, pisses 1. Sand ie 使 用 简单 








问 SRAM。 ea RI, R2, S1 # S2 oy 于 选择 4 ere 
的 信号 。 可 见 ，R1 与 地 址 0000-0FFF 对 应 ， R2 As 1000-1FFF AA, S1 和 oe NE 
地 址 C000-DFFF 和 E000-FFFF。 


Er 
si 
0000-0FFF fol oo ol tule lt pfaff et 





E000-FFFF Cea bebo Dabo be be bebe be De be Debby 


4. 地 址 译 码 

本 节 将 简介 地 址 译 码 技 术 ， 它 是 将 地 址 映射 到 处 理 器 物理 地 址 空间 中 的 方式 。 这 里 使 用 
《计算 机 组 成 原理 》 第 2 章 中 的 概念 (三 进 制 、 十 六 进 制 以 及 简单 的 逻辑 )。 因 为 地 址 译 码 多 是 
典 入 式 系统 设计 师 而 不 是 计算 机 设计 师 要 考虑 的 事情 ， 有 些 读者 可 能 希望 忽略 这 部 分 内 容 。 

在 所 有 可 能 中 最 好 的 情况 是 ， 计 算 机 具有 位 地 址 总 线 可 以 访问 2" 个 字 ， 同 时 存储 部 
FA n 位 地 址 输入 和 2" 个 存储 器 位 置 。 实 践 中 ,实际 系统 可 能 有 几 种 不 同 的 存储 设备 连接 
到 处 理 器 的 总 线 。 如 果 计 算 机 处 理 器 有 32 位 地 址 总 线 ， 可 访问 2” 个 字 节 ,其 存储 模块 CF 
储 器 的 基本 元 件 为 一 个 芯片 ， 而 存储 模块 是 一 个 包含 多 个 存储 芯片 的 电路 板 ) 提供 2” 个 字 
节 (512MB) 的 存储 ; 即 需 要 2”/2”=2 =8 个 模块 来 满足 处 理 器 的 空间 需求 。 此 时 需要 一 种 
将 存储 模块 的 地 址 空间 映射 到 处 理 器 地 址 空间 的 方法 。 称 为 地 址 译 码 器 的 电路 用 来 检测 对 特 
定 存 储 模 块 的 访问 ,一 旦 CPU 产生 的 地 址 落 在 某 存储 模块 的 地 址 空间 中 ,- 则 将 该 模块 对 应 
的 CS 信号 变 为 有 效 。 
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图 2-12 说 明了 为 什么 需要 地 址 译 码 。 假 设 处 理 器 使 用 地 址 线 Aw ~ As, 访问 4096MB 
的 地 址 空间 ; 即 22=4096MB。 该 系统 采用 3 个 512MB 的 存储 模块 二 每 个 模块 由 地 址 线 
Ai ~ Azs 访问 。 


CPU 地 址 空间 


单独 的 512MB 存储 模块 ”该 图 表明 处 理 名 
的 4096MB 空间 


EE DRAM 地 址 空间 以 及 3 个 512MB 
Pee 存储 模块 的 存储 
= 空间 。 地 址 译 码 
存储 模块 地 址 空间 oo E 的 作用 是 将 每 个 
由 Az ~ Au 访问 存储 模块 的 地 址 
CPU 地 址 空间 S 空间 映射 到 处 理 
由 Ai ~ Au 访问 S 器 的 地 址 空间 


图 2-12 “处理 器 地 址 空间 和 存储 器 空间 之 间 的 关系 
图 2-13 显示 了 这 3 个 512MB 的 模块 是 如 何 映射 到 处 理 器 的 存储 空间 中 的 。 虽 然 已 将 模 
块 映射 到 存储 空间 相 邻 的 区 域 ， 但 没有 规定 物理 存储 器 必须 被 映射 到 相 邻 的 块 。 当 然 ， 如 果 
存储 区 域 不 连续 ， 程 序 员 或 操作 系统 在 加 载 程序 和 数据 时 就 需要 特别 小 心 。 模 块 1 分 配 的 地 
址 空间 为 0000 0000 到 1FFF FFFF, 模块 2 的 为 2000 0000 到 3FFF FFFF， 模 块 3 的 为 4000 
0000 到 SFFF FFFF。 当 然 ， 每 个 S12MB 的 块 都 是 由 Ao ~ Az 访问 。 
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FFFF FFF 


2-13 ”将 存储 器 空间 映射 到 处 理 器 空间 


图 2-14 显示 了 如 何 设 计 执 行 存储 模块 映射 到 处 理 器 地 址 空间 的 逻辑 。3 个 模块 中 的 每 个 
模块 的 29 个 地 址 线 都 与 处 理 器 Ao ~ Azs 连接 在 一 起 。 用 从 处 理 器 那里 剩 下 的 3 根 地 址 线 
An ~ Az, 选择 某 存储 模块 ， 即 这 些 地 址 线 产 生 的 信号 可 以 选中 对 应 的 存储 模块 。 

第 一 块 存储 器 512MB 空间 的 地 址 为 0000 0000,, 至 IFFF FFFF,。。 该 模块 在 As1A3oAs=000 
时 被 选中 。 同 样 ， 第 二 块 存储 器 空间 的 地 址 为 2000 0000,, 至 3FFF FFFFie， 该 模块 在 
A3,A39A29=001 时 被 选中 。 i 

这 里 不 再 进一步 探讨 地 址 译 码 ， 因 为 这 是 系统 设计 者 和 电子 工程 师 要 考虑 的 问题 。 地 址 
译 码 可 以 用 来 匹配 存储 部 件 和 CPU 的 地 址 空间 ， 它 还 可 以 做 得 更 多 。 例 如 ， 可 以 在 多 个 存 
储 器 模块 之 间 实 现 切换 来 保证 任务 在 物理 上 是 彼此 分 离 的 (一 种 内 存 管理 的 形式 )。 
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FFFF FFFF 





图 2-14 ”地 址 译 码 器 的 实现 


2.2.2 ”交叉 存储 器 


如 果 存 储 器 的 访问 时 间 为 如。， 则 不 能 减少 其 访问 时 间 。 但 是 可 以 通过 交叉 (interleaving) 
来 减少 有 效 存 取 时 间 (effective access time)。 若 某 存 储 位 置 在 T 时 刻 开 始 访问 ， 则 数据 在 
时间 后 变 为 有 效 。 在 同一 存储 模块 内 另 一 个 位 置 处 的 数据 至 少 要 再 等 te 时 间 后 才能 获 
取 。 但是， 可 以 同时 访问 其 他 的 存储 模块 ; 即 并 行 访问 多 个 存储 器 模块 。 

图 2-15 说 明了 这 种 交叉 的 效果 ， 图 中 两 
个 存储 体 并 行 排列 。 如 果 在 To 时 刻 访问 第 一 个 
存储 体 ， 数 据 在 .时间 后 变 为 有 效 。 如 果 在 
Tytteye (其 中 为 时 钟 周期 时 间 ) 时 刻 访问 第 二 
个 存储 体 ， 则 第 二 个 数据 元 素 在 To+kyxttee 时 间 
后 有 效 。 如 果 tye < t。， 则 可 以 比 在 没有 交叉 时 
更 早 地 完成 第 二 次 访 存 任务 。 只 有 在 一 个 存储 
体 访问 数据 时 能 够 产生 另 一 个 存储 体 中 操作 数 
的 地 址 时 ， 有 效 的 交叉 才能 实现 。 ae $ 

存储 交叉 技术 被 称 为 低位 交 又 ， 其 中 存储 >>> eee 
地 址 的 低位 用 来 选择 存储 体 。 假 设 处 理 器 有 32 
位 地 址 总 线 和 64 位 数据 总 线 。 地 址 位 Au ~ As, Pe 
用 来 选择 存储 器 中 的 一 个 字 ， 地 址 位 Au ~ Au (通过 字 节 选 通信 号 ) 用 来 选中 当前 字 中 的 
一 个 或 多 个 字 节 。 使 用 地 址 位 Ao 执行 存储 体 选择 ， 所 有 奇数 号 地 址 的 数据 字 从 一 个 存储 体 
中 取出 ， 而 所 有 偶数 号 地 址 的 数据 字 从 另 一 个 存储 体 中 取出 。 如 果 使 用 两 个 地 址 位 来 实现 交 
叉 ， 则 可 以 实现 4 个 存储 体 并 行 访问 。 在 现代 微机 中 ， 双 通道 或 三 通道 内 存 的 原理 同 交叉 的 
原理 相同 ， 人 允许 同时 访问 2 一 3 个 DRAM 存储 模块 。 


CPU 
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| 存储 器 容量 / 性 能 

| 虽然 SRAM 已 落后 于 DRAM 的 使 用 ,但 SRAM. WRN AR E. DRAM 生 
产 已 经 被 某 几 家 制造 商 礁 断 。 下 图 使 用 由 Reneas Electronics 公司 ISSCC2009 (3/3 ) 85 
% (2009 # 4A 168) 发 布 的 数据 ,给 出 了 SRAM, DRAM 和 MRAM (磁性 RAM， 
| 稍 后 将 讨论 ) 的 存储 容量 与 访问 时 间 。 


存储 容量 (位 ) 












@ 高 性 能 MRAM 
(32 位 ,| 12ns) 


wo 9 20 10 
访问 时 间 (ns) 


aniline misono tenis eis itt 
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下 面 将 介绍 DRAM 的 工作 原理 。 通 过 几 代 DRAM 设备 的 不 断 发 展 ， 它 们 基于 相同 的 
基本 工作 原理 ， 但 使 用 不 同 的 技术 来 降低 平均 访问 时 间 。 下 面 将 介绍 基本 的 DRAM， 讨 
论 其 不 同 的 变种 ， 如 页 模式 DRAM、 半 字 节 模式 DRAM、EDO 存储 器 、SDRAM 和 DDR 
DRAM。 


2.3 DRAM 


KBB PC 机 和 工作 站 使 用 DRAM 实现 主 存储 器 ， 它 已 经 在 高 性 能 计算 机 的 发 展 中 起 
到 关键 作用 ， 表 现 为 其 工作 参数 不 断 发 展 变化 且 出 现 新 的 变种 。 我 认为 DRAM 在 不 入 的 将 
来 仍然 是 主流 。 本 节 首 先 描述 DRAM 的 工作 原理 ， 接 着 介绍 它 的 时 序 ， 然 后 介绍 DRAM 系 
列 ， 最 后 描述 它们 如 何在 微机 中 使 用 。 


DRAM 的 历史 0 
|. DRAM 此 短处 理 器 出 现 得 时 一 点 。 FRE, 世界 上 第 一 区 用 DRAM 2 $ AŽ Intel 
的 1103 (1024 位 ) 存储 器 。 CSS 

RAP — HERI — AL 3h B EAE B W RT SL AAS 1966 $ R.H.Denning # 








动态 随机 访问 存储 器 ( dynamic random access memory, DRAM) 的 工作 原理 很 简单 。 


FE 65 


数据 以 存储 在 晶体 管 中 的 静电 电荷 的 形式 保存 。 当 材料 不 带电 时 ， 材 料 中 的 电子 数 等 于 质子 
数 ; 即 电子 的 负电 荷 抵 消 了 带 正 电 的 质子 ， 因 此 不 带电 。 当 材料 充电 后 ， 电 子 要 么 被 添加 要 
么 被 移 除 。 如 果 有 太 少 的 电子 , . 则 电 性 为 正 ; 如 果 有 太 多 的 电子 ,， 则 电 性 为 负 。 在 微小 的 电 
容 上 有 极 性 还 是 没有 极 性 这 个 信息 可 以 用 来 存储 一 个 比特 。 人 们 所 要 做 的 就 是 为 电容 充电 、 
放电 以 及 检测 其 是 否 带电 。 

图 2-16 显示 了 场 效应 晶体 管 的 基本 原理 ， 它 是 大 多 数 逻 辑 设备 的 基本 元 件 。 掺 杂 
( doped) 硅 蕊 片上 的 一 个 微小 区 域 有 两 个 端子 分 别 连 到 电池 正 、 负 极 。 挫 杂 这 个 词 意 味 着 
在 硅 芯 片 中 挫 和 人 杂质 使 电子 流 可 以 自由 通过 硅 〈 纯 硅 中 电子 受到 束缚 而 不 能 穿 过 硅 材料 )。 
图 2-16a 中 ， 两 个 端子 之 间 有 电流 流动 。 





© Cengage Learning 2014 


a) 门 极 上 没有 充电 b) 门 极 上 有 负电 c) DRAM 位 元 
图 2-16 带电 门 极 对 电子 流 的 影响 


图 2-16 中 ,在 硅 区 域 上 方 的 导电 体 被 标记 为 门 极 。 假 设 其 与 图 2-16a 中 两 个 端子 之 间 
硅 通道 中 的 电子 流 是 绝缘 的 。 

在 图 2-16b 中 ， 对 门 极 充 上 负电 荷 。 电 荷 产生 静电 场 ， 穿 过 硅 通道 。 因 为 门 极 上 电荷 是 
负 的 ， 故 通道 中 的 电子 被 排斥 (同性 电荷 相 斥 ， 异 性 电荷 相 吸 )。 图 2-16b 中 ， 所 充 的 负电 
荷 十 分 强大 ， 通 道 处 于 夹 断 (pinched) 状态 ， 没 有 电流 通过 该 通道 。 

通过 对 门 极 充 负电 荷 还 是 不 充 负电 荷 ， 可 以 控制 流 过 通道 的 电流 。 所 有 门 极 都 是 通过 这 
种 方式 来 切断 电子 流 的 。 它 还 可 用 于 DRAM 以 及 包括 EPROM, EEPROM 和 Flash EPROM 
在 内 的 大 部 分 时 间 为 读 的 存储 器 。 

如 果 将 负电 压 加 到 门 极 上 以 便 对 其 充电 ， 从 而 使 晶体 管 关闭 。 当 撤去 电压 时 ， 晶 体 管 仍 
然 不 能 导 通 直到 电荷 消除 如 果 门 极 与 通道 绝缘 ， 消 除 电 荷 的 时 间 可 能 需要 几 毫 秒 。 

在 电容 中 保存 电荷 是 形成 单 晶体 管 DRAM 位 元 的 基础 。 在 门 极 上 充电 使 晶体 管 处 于 两 
种 状态 之 一 。 图 2-16c 展示 了 一 个 单 晶体 管 DRAM 位 元 的 结构 。 

保存 的 电荷 最 终 会 泄漏 ， 存 储 在 位 元 中 的 任何 数据 都 会 丢失 ,使 所 有 位 元 处 于 相同 的 状 
态 。 为 了 使 保存 的 电荷 具有 记忆 效应 ， tr Va R A 
后 将 其 写 回 晶体 管 。 这 种 操作 称 为 刷新 (refreshing) 

第 一 代 DRAM 存储 器 的 刷新 是 一 场 焉 梦 ， 需 要 复杂 的 电路 和 定时 器 ， 因 此 开销 很 大 。 
只 要 可 能 ， 设 计 师 就 会 使 用 SRAM 来 避免 使 用 DRAM 进行 系统 设计 带 来 问题 。 今 天 情况 已 
经 好 转 ， 因 为 将 刷新 逻辑 设计 在 DRAM 芯片 中 使 DRAM 的 刷新 要 求 大 大 简化 。 


66 H2F 





| Too RARAEARA TAM 
RAM. a pees ss 32 : 















中 每 小 时 软 错误 的 量 级 是 21 个 ( 即 大 约 与 赢得 彩票 的 概率 相同 )。 : 
“系统 需要 纠 错 存储 器 来 提高 可 靠 性 ， 其 中 每 个 字 存 储 一 个 附加 位 用 于 修复 软 错误 。 
典型 的 错误 检测 和 纠 钳 到 (EDC). 是 汉 明 码 (Hamming Code). 


图 2-17 给 出 了 DRAM 的 结构 。 乍 一 看 ， 它 似乎 与 静态 存储 器 芯片 非常 相似 ， 除了 两 个 
低 电 平 有 效 的 控制 输入 。 除 了 片 选 CS 外 ， 还 有 行 地 址 选 通 RAS (row address strobe) 和 列 地 
址 选 通 CAS (column address strobe), DRAM 接口 不 同 于 静态 RAM 接口 的 一 个 重要 方面 是 : 
动态 存储 器 使 用 多 路 复 用 地 址 总 线 (multiplexed address bus) 来 减少 地 址 引 脚 的 数量 。 即 使 
用 两 步 来 获得 地 址 。 例如， 一 个 28 位 地 址 的 256Mb 芯片 ， 有 14 位 地 址 输入 ，28 位 的 地 址 
必须 是 连续 两 个 14 位 值 的 合并 。 在 存储 器 访问 的 开始 ， 该 芯片 提供 14 位 的 行 地 址 以 给 出 所 
需 位 元 所 在 行 ， 然 后 通过 相同 的 引 脚 给 出 第 二 个 14 位 的 列 地 址 。 通 过 RAS 信 号 来 获得 行 地 
址 ， 使 用 与 CAS 信 号 来 获得 列 地 址 。 然 后 才能 访问 给 定 行列 位 置 的 位 元 。 


2” 丰 位 置 对 应 
地 址 数量 的 一 
44 (m/2 ) 


NS DRAM 


控制 信号 
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图 2-17 DRAM 存储 部 件 的 输入 与 输出 


将 地 址 总 线 从 28 位 减少 到 14 位 需要 两 个 阶段 来 锁 存 地 址 。 ;由 行 地址 选 通 RAS 锁 存 14 
位 行 地 址 ， 列 地 址 选 通 CAS 锁 存 14 位 列 地 址 。 地 址 复 用 以 及 RAS 和 GAS 的 选 通 控制 由 片 外 
逻辑 提供 。 

图 2-18 给 出 了 DRAM 存储 器 的 内 部 结构 。 最 需要 注意 的 一 点 是 其 中 包含 不 止 一 个 存储 
阵列 。 商 用 芯片 通常 由 4 个 存储 阵列 或 存储 体 组 成 。 

图 2-19 给 出 了 某 4MB 的 DRAM 的 结构 ， 其 地 址 为 Aw ~ An, FH 32 + 1Mb 的 DRAM 
芯片 构成 。 来 自 计算 机 的 地 址 线 Au ~ Ap, 可 以 选择 2” 个 32 位 的 字 。DRAM 存储 子 系统 使 
用 多 路 复 用 器 从 地 址 总 线 上 选择 行 或 列 地 址 。 控 制 单元 根据 CPU 的 控制 信号 产生 DRAM 的 
RAS、CAS 和 W 信 和 号。 

介绍 了 DRAM 的 基本 概念 后 ， 下 一 步 将 介绍 它 的 时 序 ， 因 为 时 序 是 理解 所 有 DRAM 后 
期 变化 的 关键 。 


到 的 软 错误 是 不 可 能 被 禁止 的 。 poererrtrers i IGbit #9 DRAM 4 2 
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图 2-18 DRAM 芯片 结构 
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图 2-19 DRAM 系统 的 结构 ， 不 包含 字 节 选择 逻辑 
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2.3.1 DRAM 时 序 


本 节 首 先 介绍 20 世纪 80 年 代 经 典 的 DRAM 时序， 所 有 现代 DRAM 时 序 均 可 由 其 变 
化 得 到 。 虽 然 DRAM 存储 位 元 是 由 一 个 晶体 管 构成 这 一 一 属性 基本 没有 变化 ， 了 人 解 DRAM 
时 序 的 基本 属性 是 为 了 理解 ，DRAM 是 如 何 一 代 一 代 变 得 更 快 的 。 图 2-20 给 出 一 个 简化 的 
DRAM 芯片 的 读 周期 时 序 图 。 假定 1Mb 的 芯片 组 织 具 有 2” 个 地 址 ， 每 个 地 址 1 位 。 


: 一 一 
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图 2-20 DRAM 读 周 期 时 序 


来 自 CPU 的 20 位 地 址 Aw ~ Ary 被 送 到 一 个 多 路 复 用 器 ,要么 选择 Ay 一 Aos( 行 地 址 ) 
要 么 选择 Ay ~ Am ( 列 地 址 )。 CPU 地 址 多 路 复 用 器 (MPLX) 的 10 个 输出 连接 到 DRAM 
地 址 输入 Ai 一 Aso 

图 2-20 中 的 读 周 期 从 4 持续 到 有 B， 最 短 持 续 时 间 为 tec, 即 读 周 期 时 间 (read cycle 
time)。 静 态 存 储 器 的 存储 周期 与 访问 时 间 相 同 ; 动态 存储 器 的 存储 周期 比 其 访问 时 间 要 长 。 
因为 在 当前 访问 结束 后 ， 在 两 次 访问 之 间 , DRAM 需要 执行 被 称 为 预 充 电 (pre-charging) 
的 内 部 操作 ， 因此 不 能 开始 新 的 访问 ， b 


MEA 





TET CPU CER 0 位 地 址 A ~ A,。 然 后 ， AC, 行 地 
址 选 通 (row address strobe, RAS) 变 为 低 电 平 有 效 ， 将 行 地 址 保存 到 芯片 内 部 的 锁 存 器 。 
一 县 获得 行 地 址 ， 从 处 理 器 来 的 低位 地 址 就 是 多 余 的 ， 周 期 剩余 部 分 不 再 需要 它 。 相 比 之 
下 ，SRAM 的 地 焉 必须 在 整个 读 或 写 周 期 中 保持 稳定 。 
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KA CPU 的 高 10 位 地 址 接着 被 交 给 存储 器 的 地 址 输入 ,然后 列 地 址 选 通 ( column 
address strobe, CAS) 在 五 点 变 为 低 电 平 有 效 呈 锁 存 列 地 址 。 此 时 ， 所 有 20 位 地 址 都 已 交 
给 存储 器 ,系统 可 以 改变 地 址 总 线 的 内 容 ， 因 为 DRAM 已 获得 了 地 址 。 

一 旦 CAS 变 为 低 电 平 ， 根 据 地址 选中 的 存储 单元 将 数据 放 到 其 数据 输出 端口 ， = 
CPU 读 取 。 读 周期 结束 时 ; CAS 变 为 高 电 平 无 效 ， 数 据 总 线 被 关闭 ， 变 为 悬浮 状态 。RA 
和 CAS 可 以 同时 、 也 可 以 次 序 任 意 变 为 高 电 平 。 无论 谁 先 变 为 高 电 平 都 无 所 谓 ， epee 
时 序 满足 要 求 。 要 使 对 DRAM 的 解释 更 容易 理解 ， 需 要 将 它 分 为 几 个 部 分 ， 并 从 地 址 引 脚 
的 作用 开始 讨论 。 

详细 的 DRAM 地 址 时 序 如 图 2-21 所 示 。 H cru] 
行 地 址 必须 在 RAS 信 号 下 降 沿 到 来 之 前 稳定 。” 的 地 址 0 
BD tase IEE (即行 地 址 建立 时 间 )。 由 于 
tasr 的 最 小 值 可 能 是 0ns， 此 时 行 地 址 的 建立 BAS, 
时 间 为 零 ， 不 需要 在 RAS 信 号 下 降 沿 到 来 之 
前 有 效 。 最 坏 情况 下 ， 它 必须 在 RAS 信 号 下 cas | 
降 沿 到 来 之 前 有 效 。 当 RAS 已 经 变 为 低 电 平 ， 
行 地 址 必须 稳定 tran 时 间 不 改变 ， 即 行 地 址 图 2-21 DRAM Maat IS 
保持 时 间 。 保 持 时 间 限 制 了 在 此 之 后 列 地 址 才 可 以 被 多 路 复 用 到 芯片 上 的 地 址 引 脚 上 。 

一 旦 行 地 址 保持 时 间 已 经 得 到 满足 ， 列 地 址 可 以 复 用 到 存储 器 的 地 址 引 脚 ，CAS 就 可 以 
变 为 低 电 平 。 列 地 址 的 建立 时 间 tsc 通常 最 小 为 0ns ; 即 CAS 可 以 在 列 地址 有 效 的 同时 变 为 
低 电 平 。CAS 变 为 低 电 平 有 效 后 ， 列 地 址 必须 稳定 toan 时 间 才 可 以 改变 ， 这 就 是 列 地 址 保持 
时 间 。 一旦 keAa 已 经 得 到 满足 ， 地 址 总 线 在 当前 访问 中 就 没有 作用 了 。 

行 地 址 必须 在 行 地 址 选 通信 号 下 降 沿 到 来 之 前 保持 有 效 tasr 时 间 ， 且 在 下 降 沿 之 后 保持 
有 效 tran 时 间 。 同 样 ， 列 地 址 必须 在 列 地 址 选 通信 和 号 下 降 沿 到 来 之 前 保持 有 效 tase 时 间 ， 且 
在 下 降 沿 之 后 保持 有 效 kag 时 间 。RAS 和 CAS 下 降 沿 之 间 的 最 小 时 间 为 cp， 该 时 间 由 行 地 
址 保持 时 间 、 多 路 复 用 器 切换 时 间 和 列 地 址 建立 时 间 组 成 。 

图 2-21 中 的 一 个 重要 参数 是 txcb， 即 由 其 他 参数 决定 的 行列 选 通 时 间 。trco 的 最 小 值 
由 行 地址 保持 时 间 、 多 路 复 用 器 切换 时 间 和 列 地 址 建立 时 间 决 定 。trco 的 最 大 值 为 伪 最 大 值 
(pseudomaximum )， 此 时 超出 了 了 存储 器 的 访问 时 间 。 如 co (max), trac M tence 之 间 的 关系 为 : 
加 cp (max) =tractcaco | 

通过 RAS 和 CAS 就 可 以 锁 存 地 址 ， 芯 片 数据 引 脚 上 就 会 出 现 数据 ， 如 图 2-22 所 示 。 为 
清晰 起 见 , 图 2-22 4 RMH TRAS, CAS 以 及 数据 信号。 假设 W 信 和 号 在 读 周期 内 为 高 电 平 ， 
地 址 建立 时 间 、 人 
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图 2-22 DRAM 读 周 期 中 的 数据 时 序 


70 G2F 


RAS 下 降 沿 之 后 ， 数 据 引 脚 上 的 数据 在 trac 时 间 后 开始 有 效 ， 这 就 是 行 地址 选 通 后 的 访 
间 时 间 。 可 见 ,， 行 访问 时 间 只 有 在 其 他 条 件 都 满足 了 之 后 才能 实现 。 列 地 址 选 通 具 有 两 个 
功能 : 锁 存 存储 阵列 相应 的 列 地 址 ， 以 及 打开 数据 输出 缓冲 。CAS 下 降 沿 之 后 ,数据 至 少 在 
tcAc 时 间 内 不 可 用 ， 这 是 列 地 址 选 通 后 的 访问 时 间 。 

当 CAS 在 读 周期 结束 后 变 为 高 电 平时 ， 数 据 总 线 被 关闭 ,并 悬浮 for 时 间 (输出 缓冲 关 
HIER). RASER (或 写 ) 周期 结束 时 没有 作用 。 可 以 在 CAS 之 前 或 之 后 改变 RAS， 只 要 它 
的 时 序 要 求 得 到 满足 。 

数据 在 CAS 下 降 沿 到 来 以 后 保持 不 多 于 teac 时 间 ， 且 在 RAS 下 降 沿 之 后 保持 不 多 于 trac 
时 间 。 周 期 结束 时 ， 数 据 总 线 缓冲 在 最 早 的 RAS 和 CAS 上 升 沿 torr 时间 内 被 关闭 。 

DRAM 的 读 取 周 期 时 序 图 需要 考虑 
的 最 后 一 个 问题 是 ， 行 和 列 地 址 选 通 的 
时 序 要 求 ， 如 图 2-23 所 示 。RAS 和 CAS 
用 来 锁 存 地 址 控制 内 部 操作 和 三 态 组 
冲 器 。 

图 2-23 中 的 基本 参数 是 如 ec， 即 读 
周期 时 间 ， 这 是 连续 的 存储 器 周期 之 
间 最 短 的 持续 时 间 。 在 每 个 读 周 期 中 ， 
RAS 选 通 必须 至 少 保持 tras 时 间 ( 行 地 址 选 通 脉冲 宽度 )。 典 型 的 最 大 值 为 10 000ns， 这 是 
由 于 设备 需要 刷新 且 不 能 出 现 问题 导致 的 ， 该 时 间 是 微 处 理 器 读 周期 的 多 倍 。 在 RAS 失 效 
后 ， 它 必须 保持 高 电 平 至 少 如 时 间 ， 这 是 行 地 址 选 通 预 充电 时 间 (动态 存储 器 芯片 的 相关 
内 部 操作 )。 时 序 的 最 后 一 个 约束 为 RAS 相 对 CAS 的 保持 时 间 sg。RAS 必 须 在 CAS 有 效 后 保 
持 低 电 平 asa 时间。. 

列 地 址 选 通 时 序 的 要 求 与 行 地 址 选 通 的 类 似 。CAS 必 须 有 效 至 少 kss 时间 ， 在 下 一 个 
RAS 下 降 沿 到 来 之 前 必须 失效 至 少 tor 时 间 ， 且 从 当前 RAS 下 降 沿 开始 至 少 保持 tcsy 时 间 
有 效 。 

写 周 期 时 序 

DRAM 存储 器 的 写 周 期 比 相应 的 读 周期 更 复杂 ， 因 为 对 其 W 和 数据 输入 信号 提出 了 严 
格 的 要 求 。 通 过 对 读 周 期 时 序 图 的 介绍 ， 这 里 不 需要 重复 介绍 相同 的 过 程 。 图 2-24 给 出 了 
简化 的 DRAM 存储 器 写 周 期 的 时 序 图 。 这 是 一 个 提前 写 周 期 (early write ceycle)， 因 为 W 信 
号 在 CAS 变 为 低 电 平 之 前 有 效 。 某 些 DRAM 的 写 周期 中 , :WW 信 号 是 在 CAS 变 为 低 电 平 之 后 
才 有 效 的 。 读 与 写 周 期 中 的 RAS、CAS 以 及 地 址 输入 的 时 序 要 求 是 相同 的 。 

写 命令 信号 W ， 由 CAS 信 号 的 下 降 沿 锁定 ， 建 立时 间 为 twcs。 一 旦 有 效 ，W 为 低 电 平 的 
最 小 持续 时 间 为 Ap， 在 CAS 下 降 沿 之 后 至 少 .和 er MARIAM. WW 信号 必须 在 RAS 信 
号 上 升 沿 到 来 之 前 至 少 有 效 tew 时 间 ， 且 在 CAS 信 号 上 升 沿 到 来 之 前 至 少 有 效 toy, 时 间 。 写 
周期 中 的 关键 事件 是 CAS 信 号 的 下 降 沿 ， 因 为 它 锁 存 克 信 号 和 向 DRAM 输入 的 数据 。 

数据 在 CAS 信 号 的 下 降 沿 写 和 存储器。 数据 输入 时 序 的 需求 简单 直接 ， 只 涉及 3 个 参 
数 。 写 人 存储 器 的 数据 必须 在 CAS 信 号 的 下 降 沿 到 来 之 前 有 效 ths 时 间 (数据 建立 时 间 )， 且 
在 其 后 继续 维持 ta 时 间 (数据 保持 时 间 )。 
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图 2-23 DRAM 行 和 列 地 址 选 通 的 详细 时 序 
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图 2-24 DRAM 写 周 期 时 序 


2.3.2 DRAM 技术 的 发 展 


前 面 已 经 介绍 了 基本 的 DRAM。 下 面 开始 介绍 页 (page) 模式 、 半 字 节 (nibble) 模式 、 
静态 列 (static column) 模式 等 改进 的 DRAM。 这 些 变化 仍然 利用 行列 地 址 输入 多 路 复 用 ， 
同时 克服 了 访问 之 间 预 充电 造成 一 些 限制 。 

页 模式 允许 快速 访问 给 定 行 中 的 任意 列 位 置 ， 如 图 2-25 所 示 。 假 设 某 1Mb 的 DRAM 
处 于 一 个 正常 的 读 或 写 周期 中 。 首先 给 定 10 位 行 地 址 ，RAS 信 和 号 变 为 低 电 平 有 效 将 其 锁 
存 ， 从 而 选中 一 行 。 其 次 为 列 地 址 ， 然 后 是 CAS 信 号 有 效 , 接着 访问 给 定位 置 。 页 模式 通过 
给 出 连续 的 CAS 脉 冲 ， 且 在 每 个 CAS 选 通信 号 下 降 沿 锁 存 新 的 列 地 址 来 连续 访问 同一 行 中 的 
数据 。 


给 出 行 地 址 连续 的 列 地 址 


ee es 
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图 2-25 DRAM 页 模式 |. 


连续 页 模式 访问 中 ， 列 访问 周期 是 sec， 这 大 约 是 原 访问 周期 时 间 的 一 半 。 页 模式 允许 
对 单一 行 地 址 的 突 发 访问 ， 比 基本 DRAM 周期 时 间 要 好 。 页 模式 对 从 连续 地 址 访问 一 批 数 
据 (例如 ， 成 块 数据 传输 或 光栅 扫描 图 形 处 理 ) 来 说 特别 有 用 的 。 页 模式 及 其 他 突 发 模式 
可 用 符号 4:2:2:2 来 描述 ， 这 意味 着 第 一 个 访问 延迟 为 4 个 周期 ， 以 后 的 数据 元 素 只 需要 经 
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过 两 个 周期 即 可 获得 。 今 天 ,- 页 模式 DRAM 已 经 过 时 (在 大 多 数 DDR2 和 DDR3 之 前 的 
DRAM 变种 中 也 是 这 样 ) 。 

半 字 节 模 式 DRAM 具有 一 些 页 模式 的 特点 但 速度 更 快 。 半 字 节 模式 访问 开始 时 与 普通 
DRAM 访问 相同 ， 都 是 先 获 取 行 地 址 再 获取 列 地 址 。 如 果 CAS 选 通信 号 重复 出 现 ， 则 对 连 
续 4 个 位 置 进 行 读 (或 写 ) 操作 而 不 需要 提供 新 的 列 地 址 。 

图 2-26 给 出 了 半 字 节 模 式 的 时 序 。 不 同 于 页 模式 ， 半 字 节 模式 只 是 在 突 发 访问 开始 时 
锁 存 单一 的 列 地 址 。 接 下 来 的 访问 顺序 (使 用 循环 出 现 的 CAS) 以 00、01、10、11、00、10 
的 顺序 出 现 。DRAM 自己 在 内 部 自动 产生 序列 地 址 。 例 如 ， 如 果 访 问 位 置 0x0 1234， 然 后 
循环 出 现 的 CAS ， 将 访问 的 位 置 为 0x0 1234, 0x0 1235, 0x0 1236 和 0x0 1237 ( 按 顺 序 访问 )。 
第 一 个 半 字 节 模 式 访问 时 间 与 读 或 写 周期 的 时 间 相 同 。 后 续 访 问 时 间 要 比 普通 的 访问 周期 的 
一 半 还 要 少 。 

给 出 行 地 址 给 出 列 地 址 





2-26 DRAM 半 字 节 模式 


随 着 系统 速度 加 快 ，DRAM 制造 商 开 发 了 降低 DRAM 访问 时 间 的 其 他 方法 。 扩展 数据 
输出 (extended data out, EDO) Æ DRAM 页 模式 的 变种 ， 它 比 页 模式 DRAM 具有 更 短 的 页 
周期 时 间 。EDO 设备 在 CAS 变 为 高 电 平时 不 关闭 其 输出 。 数 据 在 CAS 下 降 沿 有 效 ， 所 以 设 
计 师 可 以 使 用 CAS 信 号 来 选 通 数据 。 

1. SDRAM l 

快速 页 模式 DRAM 和 EDO DRAM 都 是 DRAM 的 变种 。DRAM 技术 史上 第 一 个 根本 
变化 发 生 在 1997 年 前 后 ,/ 出 现 了 与 以 前 的 DRAM 具有 不 同 接口 的 同步 DRAM (SDRAM), 
1998 年 ,SDRAM 占有 了 DRAM 存储 器 50% 的 世界 市 场 。SDRAM 使 用 系统 时 钟 进行 同步 ， 
采用 了 更 复杂 的 接口 可 以 从 处 理 器 接收 已 编码 命令 。 例 如 ，SDRAM 使 用 组 合 控制 信号 来 对 
命令 进行 编码 ， 如 读 、 写 或 预 充 电 。SDRAM 访问 时 间 与 DRAM 系列 其 他 成 员 的 访问 时 间 
AW; 然而， 它 的 突 发 访问 时 间 却 相当 短 。 

控制 信号 和 指令 在 时 钟 的 上 升 沿 锁 存 ， 这 样 做 简化 了 系统 的 设计 。SDRAM 中 的 控制 寄 
存 器 定义 了 它 的 操作 参数 ， 如 突 发 长 度 ( 即 每 个 读 或 写 周 期 访问 的 字数 )。 也 就 是 ，SDRAM 
是 一 种 操作 参数 可 以 面向 特定 系统 进行 调整 的 可 编程 装置 。 
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SDRAM 具有 多 个 存储 体 可 以 独立 操作 。 图 2-27 描述 了 SDRAM 的 读 周 期 。 在 时 钟 的 
上 升 沿 获取 命令 和 行 地 址 (周期 15ns 意味 着 频率 为 66.67MHz)。 列 地 址 在 下 一 个 时 钟 上 升 
沿 读 取 。 数 据 在 读 周期 开始 60ns 后 出 现 ， 类 似 DRAM 的 访问 时 间 。 但 是 ， 接 下 来 的 3 个 元 
素 每 隔 15ns 就 会 出 现 一 个 。 


15ns 








数据 
输出 
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图 2-27 基本 的 SDRAM 读 周期 


Rambus RAM = JAPE TORREN AG 

ETA EE AT ARID WN BERD 但 也 被 证 
明 是 一 条 死胡同 。RDRAM 规范 由 Rambus 公司 与 ntel 通力 合作 、 为 提升 高 性 能 系统 中 
RDRAM 技术 的 性 能 而 创建 。RDRAM 是 一 种 系统 的 方法 ， 它 涉及 存储 器 技术 和 总 线 技 
术 ， 因此 叫 作 Rambus。 缩写 RDRAM 代表 habos DRAM, 而 存储 模块 被 称 为 RIMM 
(Rambus Inline Memory Module) — 

Rambus 比 传统 的 数据 总 线 要 窗 (第 一 个 版 本 是 8 ee), -但 它 工作 在 更 高 的 时 钟 频 
率 下 。 第 一 代 Rambus 工作 在 400MHz, 而 当时 微机 的 总 线 频率 为 100MHz。 -如 果 使 用 
DDR 存储器 胡同 ripe aged ambus 的 带宽 - 





+5) SRN DRAM 复 用 了 行 和 列 的 信息 。 RDRAM Pr rerrrs 行 
和 列 信息 同时 传输 。 

在 传统 的 系统 中 ， peer Terror Tre Rambus 公司 使 用 了 传输 
线 技术 (transmission line technology), 该 技术 关心 高 速 脉冲 在 总 线 上 传输 的 行为 以 及 
脉冲 在 总 线 另 一 一 端的 反射 降低 总 线性 能 的 方式 。 信和 号 从 RIMM 模块 的 一 - 侧 输 入 ， 访 问 
RDRAM， 然 后 在 另 一 侧 离 开 ， 信号 用 这 种 方式 沿 着 总 线 通过 每 个 存储 器 连接 器 。 主板 
上 所 有 的 播 档 都 必须 确保 Rambus 信号 可 以 沿 着 总 线 从 一 端 传播 到 舅 二 端 。 TARA 
以 一 种 特殊 的 称 为 连续 RIMM ( continuity RIMM) a MERHER, 
cri e EERE ES Sabersiscdh i OEIT | 





74 HIF 


RIMM 3200 
RIMM 4200 


2. DDR DRAM 

DDR DRAM 或 者 double-data rate SDRAM,( 双 数据 速率 SDRAM), 与 传统 SDRAM 的 
内 部 存储 机 制 稍 有 不 同 。DDR DRAM, SDRAM 之 间 的 区 别 在 于 其 接口 。DDR SDRAM 在 
时 钟 的 上 升 沿 和 下 降 沿 都 执行 数据 访问 ; 即 它 以 时 钟 频率 两 售 的 速度 提供 数据 。 图 2-28 给 
出 了 DDR 的 读 周期 时 序 9。 一 旦 开始 进行 突 发 访问 ,数据 在 时 钟 的 每 个 边缘 都 可 出 现 。 参 数 
CAS 延迟 (CAS Latency, CL) 以 时 钟 周期 为 单位 定义 了 从 列 地 址 选 通 有 效 至 数据 有 效 之 间 
的 时 间 。 此 参数 是 反映 DDR 性 能 的 主要 参数 。 其 他 3 个 与 DRAM 相关 的 参数 是 RL ( 读 延 
R) AL (附加 延迟 ) 和 BL ( 突 发 长 度 )。 


时 名 $ 
PR 
g 
命令 T 
HE 
地 址 E 
oe 
23 
DQS 28 
25 
DQ gE 
23 








© General DDR SDRAM functionality, Micron 技术 说 明 TN-46-05。 
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3. DDR2 与 DDR3 DRAM 

每 种 技术 的 变种 如 DDR DRAM 都 有 其 寿命 。DDR 风光 后 由 DDR2 代替 。DDR2 风光 
后 就 引入 了 DDR3。 现 在 DDR4 还 在 等 着 。 在 微机 世界 中 ， 每 种 技术 的 变种 都 伴随 着 新 的 主 
板 芯片 系列 为 其 提供 连接 到 主机 CPU 的 接口 。 

与 DDR 相 比 ，DDR2 也 是 在 时 钟 的 上 升 沿 和 下 降 沿 传输 数据 ， 但 其 更 进一步 ， 可 以 在 
每 个 时 钟 周 期 内 执行 4 次 数据 传输 。 某 个 具有 64 位 数据 总 线 以 266MHz 频率 工作 的 DDR2 
存储 模块 能 够 获得 传输 数据 的 峰值 速率 是 64 x 266 x 10° x 4/8=8512MB/s。 式 中 4 表明 每 个 
周期 传输 4 个 数据 。 数 据 传输 速率 是 数据 值 的 1/8， 因 为 每 次 数据 传输 需要 8 位 。DDR2 的 
最 大 信息 传输 速率 是 1066 兆 次 传输 /s。 

DDR? 和 这 个 系列 的 后 来 成 员 在 某 种 意义 上 说 是 可 编程 的 ， 这 是 由 于 它们 具有 参数 配置 
寄存 器 ， 可 由 主机 系统 装载 操作 参数 。 例 如， 可 以 定义 DDR2 SDRAM 如 何 进行 刷新 (前面 
说 过 ， 每 个 位 元 都 需要 周期 性 地 更 新 ， 存 储 的 数据 需要 再 写 一 遍 )。 

DDR3 是 数据 传输 速率 加 倍 原理 的 进一步 扩展 ， 相 比 DDR? 其 数据 传输 率 又 翻 了 一 番 ， 
可 以 在 每 个 时 钟 周期 内 进行 8 次 访问 。 在 增加 数据 传输 率 的 同时 ，DDR3 模块 可 以 允许 单个 
芯片 的 容量 高 达 8Gb。Samsung 在 2009 宣布 第 一 款 使 用 50ns 技术 的 4Gb DDR3 DRAM， 这 
仅仅 在 Intel 刚 成 立时 发 布 其 1024 位 的 DRAM 后 的 40 年 。 那 时 的 人 们 很 难 想象 ， 存 储 世 片 
的 容量 将 在 他 的 一 生 中 以 超过 400 万 倍 的 速度 增长 。DDR3 存储 器 内 部 由 8 个 存储 体 而 不 像 
DDR2 那样 由 4 个 存储 体 构成 。 增 加 存储 体 的 个 数 可 以 增加 交叉 的 程度 。DDR3 内 核 速度 与 
DDR2 的 稍 有 不 同 。 

DDR3-1600 模块 工作 在 200MHz， 其 周期 时 间 为 Sns， 执 行 速度 为 1066 兆 次 传输 /s， 
对 应 的 数据 传输 率 为 12800MB/s。 图 2-29 给 出 了 DDR2 突 发 读 操作 的 时 序 (K A Samsung 
DDR2 SDRAM Device Operating & Timing Diagram manual)。 
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图 2-29 DDR2 DRAM 突 发 读 模 式 


动态 存储 器 设计 的 一 个 重要 趋势 是 降低 工作 电压 。DDR2 工作 在 1.8V， 第 一 代 DDR3 
工作 在 1.55V， 后 来 的 DDR3 工作 在 1.35V。 工 作 电 压 从 1.8V 降 至 1.35V 可 以 降低 功 耗 
25%, 

DRAM 技术 通过 向 运行 多 任务 的 复杂 操作 系统 以 及 处 理 音 频 和 视频 的 多 媒体 应 用 提供 
大 容量 、 经 济 的 、 直 接 访问 的 存储 器 ， 使 得 PC 世界 蓬勃 发 展 。 下 面 会 介绍 只 读 存储 器 ， 它 
虽然 只 对 PC 世界 有 适度 的 影响 ， 但 对 普 适 计算 (例如 ，MP3 播放 器 和 数码 相机 ) 有 更 大 的 
影响 。 
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Fly-By 拓扑 
主板 上 DDR3 存储 模块 的 布局 或 拓 直 与 DDR2 存储 器 不 同 。 该 变化 是 时 钟 和 信和 号 
速率 增加 的 必然 ， 这 意味 着 早期 计算 机 中 不 感 兴趣 的 电路 作用 现在 对 计算 机 产生 显著 的 
影响 。 
一 在 基于 DDR2 的 系统 中 ， 信 号 并 行 交 给 所 有 模块 。 在 基于 DDR3 的 系统 中 ， 通 过 提 
供 Fly-By 拓扑 来 改进 入 号 完整 性 ; TARTTEE BR, Boek ae Sia 等 
等 。 因 此， 信号 依次 飞 过 (fly by) BRS i 
这 种 新 拓扑 结构 的 影响 之 一 是 要 求 各 模块 的 时 序 参数 不 同 ; 即 必须 调整 模块 。 在 
启动 时 ， i (read i write se TEREPET 
DRAM 模块 的 参数 。 





4. DDR4 

2011 年 ， 正 当 DDR3 以 新 的 设计 替换 DDR2 并 越 来 越 受 欢迎 的 时 候 ，DDR4 出 现 了 。 
Samsung 是 第 一 家 提供 DDR4 模块 的 公司 。 新 的 DDR4 技术 比 DRAM 家 族 中 以 前 的 成 员 更 
快 且 能 效 更 好 。 它 采用 新 的 电路 设计 技术 ， 并 且 将 电压 从 DDR3 的 1.55V 降 至 1.2V 以 减少 
功 耗 。 自 Intel 1103 DRAM 需要 3 股 电源 (+5V, -5V 和 12V) 开始 ， 已 经 走 过 了 漫长 的 道 
路 ， 该 模块 的 数据 传输 率 仅 为 2133 比特 /s。 

介绍 完 主流 的 读 / 写 存储 设备 后 ， 在 讨论 正在 兴起 的 (目前 已 经 出 现 ) 未 来 主 存储 器 支 
撑 技 术 之 前 ， 先 介绍 一 下 只 读 存储 器 。 


DRAM 的 分 代 和 oot puna aa oe. 

下 表 显示 了 DRAM 连续 各 代 的 进展 。 表 中 给 出 了 DRAM SAK, BPE (RT 
基本 的 DRAM 和 EDO RAM 没有 统 二 时 钟 )， 假 定数 据 总 线 为 16 位 情况 下 的 数据 传输 
#, SR, 数据 传输 率 在 64 位 数据 总 ls 4 信 。 


DRAM 系列 数据 总 线 速率 /MB/s 
快速 页 模式 DRAM apna gaa pi 10 ~ 33 
DDR SDRAM 200 ~ 400 
DDR2 SDRAM 400 ~ 800 
DDR3 SDRAM 800 ~ 1600 
DDR4 SDRAM 800 ~ 1600 1600 ~ 3200 
A cS RR 
: DRAM 模块 的 外 观 i 


FAET = DRAM RHR Le PARR ARA AIA (RR 
口 )， 以 确保 正确 的 模块 被 插入 正确 的 主板 。 一 





EEE 77 





133.35 mm 










-2 73.28mm _ - 
cor ao ____ 133.35 mm 


hi ks J 
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2.4 只 读 存储 器 系列 


只 读 存 储 器 是 内 容 可 以 访问 但 不 能 被 修改 的 设备 。 今 天 ， 只 读 存 储 器 (read-only 
memory，ROM) 具有 更 广泛 的 意义 ， 它 也 包括 大 部 时 间 为 读 即 经 常 读 但 不 经 常 写 的 存储 器 
(例如 PC 的 BIOS， 它 只 在 新 的 固件 版 本 升级 时 才 会 改写 ) 。 在 打开 计算 机 之 前 ， 需 要 使 用 
只 读 存 储 器 来 储存 信息 。 例 如 ， 加 载 操 作 系 统 或 其 他 系统 参数 的 引导 程序 。 只 读 存储 器 对 于 
无 盘 系 统 来 说 至 关 重要 (例如 ， FHL, MP3 播放 器 ， 数 码 相 机 )。 此 时 ，ROM 用 来 保存 程序 
和 用 户 数 据 ， 如 音乐 、 视 频 和 图 像 。 

真正 的 只 读 存储 器 要 么 在 制造 过 程 中 要 么 在 被 使 用 之 前 可 以 编程 。 掩 模 编 程 ( Mask 
Programmed) ROM 在 其 制造 的 最 后 阶段 使 用 包含 需要 存储 数据 的 掩 膜 来 编程 。 掩 模 编 程 
ROM 的 典型 容量 为 128Mb， 其 组 织 通 常 为 16M 个 8 位 的 字 或 8M 个 16 位 的 字 。 其 访问 时 
间 为 100ns, 与 DRAM (50ns) 或 静态 RAM (10ns) 相 比较 长 。 熔 断 丝 (fusible link) ROM 
是 另 一 种 只 读 设备 。 它 在 每 个 位 元 中 使 用 一 个 微小 的 保险 丝 。 在 使 用 特殊 编程 器 进行 初始 化 
编程 时 , 每 个 保险 丝 要 么 原封 不 动 要 么 通过 足够 强 的 电 脉冲 将 其 熔断 。 

掩 模 编程 ROM 仅 适 用 于 大 规模 生产 且 不 需要 重新 编程 的 情况 ,熔断 丝 ROM: 仅 用 于 特 
殊 应 用 场合 。 成 本 低 、 容 量 大 的 应 用 ， 如 电子 词典 和 语法 书 用 掩 模 编 程 ROM 比较 合适 。 计 
算 机 世界 需要 这 样 一 种 类 型 的 只 读 存储 器 : 它 可 以 存储 大 量 的 数据 ,还 可 以 花费 较 小 的 代价 
进行 重新 编程 。 

本 节 中 ,将 介绍 电 可 编程 半导体 只 读 设备 家 族 中 的 3 个 成 员 ; 它们 是 EPROM (第 一 个 
电 可 编程 只 读 存储 器 入 EEPROM: 和 Flash EPROM. 这 3 种 存储 器 十 分 类 似 ， 唯一 的 不 同 是 
对 它们 进行 编程 和 擦 除 的 特点 与 机 制 。 然而 ， 今 天 Flash EPROM 已 经 成 为 只 读 ( 或 大 部 时 
间 为 读 ) 存储 器 的 主导 形式 。 
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2.4.1 EPROM 系列 


THEIR T 4m 42 RK His HS (EPROM) 存储 的 信息 从 来 不 修改 或 者 很 少 修改 。EPROM 
由 Intel 的 Dov Frohman 在 1971 年 发 明 ， 它 依赖 于 被 困 在 品 体 管 单元 上 的 静电 荷 (有 点 像 
DRAM 位 元 )。 图 2-30 给 出 了 由 一 个 场 效 应 草 体 管 组 成 的 EPROM 存储 位 元 。 流 经 Ve 和 Ps 
端子 之 间 P 沟 道 的 电流 ， 其 工作 过 程 与 前 面 描述 的 DRAM 晶体 管 类 似 。 通 过 对 门 极 进行 充 
E, 在 通道 中 流动 的 电流 可 以 被 开启 或 关闭 。 浮 栅 通 过 一 层 薄 的 二 氧化 硅 包 庄 并 与 其 他 导体 
绝缘 ， 从 而 构成 了 近乎 完美 的 绝缘 体 。 在 浮 栅 上 加 上 电荷 或 者 不 加 电荷 ， 可 以 打开 或 关闭 晶 
体 管 从 而 在 存储 位 元 上 存储 1 或 0。EPROM 与 DRAM 十 分 相似 ， 差 异 在 于 存储 或 删除 数据 
使 用 的 充电 方式 以 及 漏电 所 需要 的 时 间 ， 对 于 DRAM 来 说 该 时 间 为 TI0ms， 而 对 于 EPROM 
来 说 为 几 十 年 。 
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图 2-30 EPROM 存储 位 元 


如 何 对 完全 绝缘 的 浮 栅 进行 充电 ?. 浮 机 附近 有 一 个 控 栅 ， 它 也 与 浮 栅 绝 缘 。 通 过 向 控 栅 
施加 高 电压 (例如 ,，12 ~ 25V), 电子 将 穿 过 绝缘 体 到 达 浮 栅 。 虽 然 12V 看 起 来 不 像 一 个 高 
电压 ， 但 电位 差 (potential gradient) 将 产生 足够 大 的 力 使 电子 通过 只 有 很 小 间隙 的 绝缘 体 。 

一 旦 对 EPROM 编程 ， 数 据 将 保留 在 浮 栅 上 10 年 或 更 长 时 间 。 如 果 需 要 消除 电荷 ， 必 
须 将 芯片 放 在 紫外 灯 下 并 打开 芯片 表面 使 其 暴露 在 紫外 线 中 。 因 为 玻璃 对 紫外 光 来 说 是 不 透 
HHJ, ik EPROM 必 片 的 背面 装 有 用 石英 制 成 的 透明 窗户 。 此 时 所 有 数据 将 被 立即 删除 。 

第 一 代 EPROM 的 容量 小 ， 编 程 需要 轮流 对 各 个 位 置 写 数据 。 第 二 代 大 容量 EPROM 
使 用 智能 编程 算法 (smart programming algorithm) 向 每 个 存储 位 元 发 出 短 编程 脉冲 ， 且 
重复 操作 至 所 有 数据 均 已 被 正确 地 写 人 。 有 些 EPROM 是 一 次 性 可 编程 的 (one-time 
programmable)， 因 为 它们 没有 石英 窗口 〈 因 为 代价 较 高 )， 一 旦 编程 就 保持 不 变 了 。 

EPROM 提供 了 在 实验 室 中 开发 计算 机 固件 的 一 种 手段 。 不 幸 的 是 ， 其 缓慢 的 编程 过 程 
和 擦 除 的 繁琐 机 制 使 得 EPROM 不 适合 那些 甚至 只 是 偶尔 需要 编程 的 应 用 。 今 天 ， 紫 外 线 可 
RH EPROM 已 经 基本 过 时 ， 剩 下 的 EPROM 只 是 在 eBay 网 上 等 待 死亡 。 

1. EEPROM 

电 可 擦 除 可 编程 只 读 存储 器 (EEPROM) 建立 了 原始 的 EPROM 和 今天 的 闪存 之 间 的 联 
系 。 本 节 通 过 展示 EPROM 的 发 展 来 介绍 EEPROM, EEPROM fil Flash EEPROM 之 间 的 主 
要 区 别 在 于 数据 的 擦 除 方式 。EEPROM 由 Intel 的 George Perlegos 在 1978 年 研发 。 

在 EPROM F, 绝缘体 中 的 被 困 电 子 通过 紫外 光 光 子 被 删除 。 在 EEPROM 中 ， 绝 缘 层 
很 薄 以 至 于 当 芯 片 被 擦 除 时 一 种 被 称 为 Fowler-Nordheim 隧道 的 量子 力学 效应 可 以 使 电子 穿 
过 绝缘 层 。 当 在 绝缘 层 施 加 一 定 的 电压 时 ， 浮 机 上 的 电子 就 可 以 通过 绝缘 层 ， 即 使 它们 没有 
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足够 的 能 量 来 越过 该 障碍 。 在 绝缘 层 上 施加 的 电压 约 为 10'V/cem”。 表 2-3 说 明了 所 介绍 的 3 
种 可 编程 器 件 之 间 的 差异 。 


表 2-3 EPROM 系列 各 成 员 的 区 别 
| EPROW | EEPROM | FosmMemoy 


nie o o a 
SENM rom 
ET ETT 
wea | 
oT F 
me sn 
ita ie ee ede ae 


EEPROM (或 EPROM) 比 闪存 贵 且 容 量 较 小 。 闪 存 为 大 部 时 间 为 读 的 设备 ， 其 寿命 为 
10000 次 擦 除 / 写 周期 。EEPROM 的 访问 时 间 低 至 35ns 但 其 写 周 期 时 间 较 长 (10ms)。 

2. Flash 存储 器 

Flash EEPROM (今天 大 多 数 人 都 称 它 为 闪存 ) 可 实现 电 可 编程 和 擦 除 ， 这 为 计算 机 存 
储 固件 、 数 字 电子 设备 和 便携 式 应 用 提供 了 一 种 方便 的 手段 。 它 由 Toshiba 的 Fujio Masuoka 
在 1980 年 发 明 。 图 2-31 给 出 闪存 位 元 的 结构 。EPROM 中 介 于 浮 机 MOS 晶体 管 表面 之 间 
的 氮 氧 化 硅 绝缘 层 (ONO) HER 300A, m Flash EEPROM 只 有 100A ( 1A=1 x 10°m 
或 lnm)。 人 类 眼睛 可 以 看 到 的 可 见 光 的 波长 为 390 一 750nms;- 这 意味 着 浮 栅 的 厚度 约 为 最 
高 频率 可 见 光 ( 蓝 色 六 的 一 半 。 


隧道 氧化 物 
绝缘 层 
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图 2-31 Flash EEPROM 存储 位 元 


对 EPROM 编程 时 ， 可 以 通过 雪崩 效应 (avalanche effect) 让 电子 穿 过 氢 氧 化 物 绝 缘 层 
来 对 浮 栅 充电 。 这 些 电 子 由 于 其 高 动能 被 称 为 热电 子 (hot electrons), Flash EEPROM 通过 
穿 过 绝缘 体 的 电子 隧道 进行 编程 并 以 同样 的 方式 进行 擦 除 。 表 2-3 比较 了 .3 种 可 编程 设备 的 
写 / 擦 除 机 制 。 

用 户 无 法 擦 除 Flash EEPROM 中 某 个 位 元 中 的 数据 。Flash EEPROM 通常 被 分 为 典型 
大 小 为 1024 字 节 的 扇 区 =。 某 些 设备 允许 用 户 擦 除 某 个 扇 区 。 第 一 代 Flash EEPROM 只 能 执 
行 100 次 擦 除 / 写 周期 ， 而 现在 的 设备 通常 的 寿命 为 10000 次 擦 除 / 写 周期 。 实 际 的 Flash 
EEPROM 的 寿命 可 能 还 要 大 一 个 数量 级 。 

Flash EEPROM 的 编程 方式 与 EPROM 一 样 。 它 们 与 系统 的 读 接口 与 SRAM 的 读 接口 相 
似 ， 具 有 低 电 平 有 效 的 写 使 能 输入 信号 。 其 写 周 期 与 传统 SRAM 的 相同 ， 只 是 写 持续 时 间 
RKL. Flash EEPROM 具有 片上 定时 器 和 相关 的 控制 电路 ， 可 以 自动 保证 适当 的 信号 延 
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迟 而 不 需要 使 用 外 部 硬件 。 菜 些 Flash EEPROM 二 次 可 以 对 二 个 字 节 编程 ;而 另 二 些 则 可 以 
在 一 次 操作 中 对 整个 扇 区 (例如 ，1024 字 节 ) 进行 写 。Flash EEPROM 的 擦 除 机 制 因 制造 商 
而 各 不 相同 。 它 们 可 以 一 次 全 部 擦 除 也 可 以 一 次 擦 除 一 个 扇 区 。 


(AM BME sha de 


EPROM 通常 为 32?Mb， 被 安排 为 4MB。 现 代 闪 存 可 以 是 容量 为 16Gb (2Gx8) 的 
NAND 型 也 可 以 是 256Mb (16M x 16) 的 NOR 型 。NAND 和 NOR 型 闪存 位 元 的 内 部 组 织 
不 同 ， 后 面 还 将 介绍 闪存 这 方面 的 内 容 。 

3. 多 级 闪存 技术 

大 家 知道 ，DRAM Al EPROM 系列 ， 都 是 通过 电容 中 的 电荷 来 控制 通道 是 否 导 通 来 存 
储 数 据 的 。 这 些 存储 技术 唯一 的 差别 是 它们 的 结构 和 操作 参数 。20 世纪 :90 4E FRA, Intel FF 
发 了 多 级 闪存 位 元 (multi-level flash cell，MLC )， 通 过 在 控 栅 存储 可 测量 的 电荷 (measured 
charge) 来 扩展 闪存 技术 。 

通过 仔细 控制 存储 的 电荷 和 读 回 所 存储 电荷 的 电量 ; MLC 能 向 存储 位 元 中 写 人 多 位 ; 
即 多 级 技术 以 模拟 量 的 形式 存储 数据 。 浮 机 电容 、 所 存储 的 电荷 以 及 栅 极 电压 之 间 的 关系 是 
Vto=Qre/Cror, 其 中 Vig 为 浮 栅 栅 极 电压 ， Ora Fr AAR ETT , Cior 为 电容 。 

当 对 传统 的 闪存 编程 时 ， 用 户 想 向 位 元 中 充 多 少 电荷 就 充 入 多少 电 荷 ， 只 要 它 足以 改变 
状态 即 可 。 多 级 位 元 必须 被 精确 编程 ;不 能 向 MLC 位 元 中 充 人 过 量 电 荷 ， 否 则 就 会 把 某 个 
存储 级 别 转换 成 另 一 个 存储 级 别 。 每 种 存储 级 别 按照 位 模式 定义 (例如 ，00,01,10,11 )。 传 
统 的 闪存 或 SLC 闪存 感知 栅 极 电压 ， 并 将 其 与 冰 值 比较 ， 然 后 根据 结果 在 阔 值 的 上 方 还 是 
下 方 分 配 一 个 1 或 0。 MLC 技 术 将 栅 极 电压 与 此 个 参考 电 平 进行 比较 ,并 为 每 个 级 别 分 配 
一 个 二 进 制 代码 s :每 存储 10000 个 电子 浮 栅 土 的 电压 大 约 增加 1V。。 图 2-32 显示 了 ;SLC 和 
MEC 位 元 的 状态 分 布 。 


两 状态 存储 器 
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© Al Fazio and Mark Bauer, “Intel StrataFlash Memory Development and Implementation,” Intel Technology Journal, 
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ZF tHE 81 





具有 4 个 参考 水 平 的 位 元 可 以 存放 两 位 数据 ; 有 8 个 参考 水 平 的 位 元 可 以 存放 3 位 数据 ; 
等 等 。 可 以 保存 的 级 别 数 量 只 取决 于 存储 可 精确 测量 的 电荷 的 能 力 以 及 将 栅 极 上 的 电压 与 
参考 电压 进行 精确 比较 的 能 力 。 给 定位 密度 ，MLC 可 以 减少 有 效 位 元 面积 和 单 芯 片 的 尺寸 。 
这 最 终 会 导致 每 兆 字 节 成 本 的 显著 降低 。 SR, MLC EATE ERPIN 
数据 。 

”当前 的 MLC C 存 储 器 被 认为 是 一 种 消费 品 而 非 工业 产品 ， 这 是 因为 不 能 工作 在 工业 
度 范围 内 ， 也 不 如 SLC 闪存 那样 可 靠 。MLC 最 大 写 次 数 通 常 是 SLC 闪存 的 10%。 

4.NAND 与 NOR 闪存 

现代 的 闪存 被 描述 为 NOR 闪存 或 NAND 闪存 。 -NOR 闪存 由 Intel 在 1988 8 年 发 布 ， 而 
NAND 闪存 由 Toshiba 在 1989 年 发 布 。 这 两 种 闪存 之 间 的 区 别 在 于 位 元 的 组 织 .( 即 连接 方 
式 )。 一般 来 说 ,， 当 人 们 谈 到 闪存 ， 通 常 指 的 是 NOR 闪存 。 图 2-33 说 明了 NOR 和 NAND 
结构 ?最 基本 的 区 别 。 就 像 它 们 的 名 字 所 显示 的 ,存储 阵列 看 上 去 像 或 非 门 NOR 或 者 与 非 
门 NAND; 其 单元 的 连接 要 么 是 并 联 的 (NOR) 要 么 是 串联 的 (NAND)。 


NOR 闪存 阵列 NAND 闪存 阵列 
1 (并 联结 构 ) “(串联 结构 ) 


"Adapted form M-Systems White Paper, “Two Technologies Compared: 
~ NOR vs, NAND,” July 03 91-SR-012004-BL. Courtesy of SanDisk. 





”图 2.33 NOR 和 NAND 闪存 技术 





© M-Systems 白皮书 “Two Technologies Compared: NOR vs. NAND.” July 03 91-SR-012004-8L. 
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这 两 种 技术 之 间 的 主要 差异 在 于 它们 的 操作 特性 (operating characteristics), E t 
表现 在 它们 的 应 用 领域 。NOR 闪存 的 优点 是 代码 可 以 直接 在 其 中 执行 ， 称 为 芯片 内 执行 
(eXecute In Place, XIP) 原理 。 代 码 不 能 在 NAND 闪存 内 执行 ， 必 须 先 传输 给 静态 存储 器 
或 DRAM。NOR 通常 用 来 实现 相对 较 小 的 存储 器 ， 如 4MB 的 存储 器 。 

NAND 闪存 可 以 提供 更 高 的 位 元 密度 ， 但 需要 更 复杂 的 系统 接 日 (因此 不 能 直接 运行 代 
码 )。NOR WAFER BRR AA 128KB, HE 5s KH; 而 NAND 擦 除 块 可 能 是 32KB， 只 
需要 4ms 来 擦 除 。NOR 闪存 的 系统 接口 同 SRAM 的 十 分 相似 ， 而 NAND 闪存 具有 串 行 的 
一 位 的 接口 ， 并 不 是 所 有 的 供应 商都 实现 了 相同 的 串 行 数据 传输 协议 。 - 

NAND 闪存 的 另 一 个 优势 是 其 擦 写 次 数 可 达 
100 万 次 ， 远 远 高 于 NOR 闪存 的 10 万 次 。 虽 然 
允许 的 擦 除 次 数 较 多 ,但 NAND 删除 比 NOR N 
存 的 可 靠 性 差 ， 需要 使 用 纠 错 码 来 处 理 1 位 错误 8 
(类 似 在 下 一 章 中 讨论 的 CD-ROM 和 DVD)。 

NAND 闪存 中 包含 比 所 需 更 多 的 数据 块 ( 即 
它 的 存储 容量 大 于 标 称 值 )。 这 种 宛 余 是 必要 的 ， 
因为 某 些 块 可 能 是 坏 块 (bad blocks)。 系 统 软件 
持续 监控 存储 器 操作 ， 并 在 碰 到 坏 块 时 将 其 替 
换 (在 硬盘 驱动 器 中 也 会 有 类 似 的 过 程 )。 来 自 
Toshiba 报告 中 的 图 2-34 给 出 了 NAND 与 NOR 
技术 的 相对 差异 。 

5. 闪存 的 损耗 均衡 (Wear Leveling) 

由 于 电子 被 注入 位 元 或 从 位 元 中 删除 时 绝缘 体 可 能 会 受 损 ， 故 闪存 位 元 具有 有 限 的 寿 
命 。 如 果 对 闪存 阵列 中 所 有 位 元 进行 相同 次 数 的 访问 和 删除 操作 ， 阵 列 中 所 有 部 分 的 老化 程 
度 相 同 。 然 而 ， 实 际 情况 是 ， 对 存储 位 元 的 访问 并 不 均匀 。 例 如 ， 在 MP3 播放 器 中 ， 某 些 
音乐 可 能 没 被 听 过 ， 而 其 他 音 轨 被 经 常 播放 。 因 此 ， 数 组 中 某 些 位 元 可 能 被 永久 损耗 ， 而 其 
他 位 元 仍然 能 够 进行 多 次 擦 除 。 

可 以 采用 闪存 耗损 均衡 (flash wear leveling) 的 概念 来 缓和 分 布 不 均匀 地 擦 除 。 静 态 
(static) 损耗 均衡 将 固定 数据 移动 至 使 用 频 度 较 高 的 区 域 ， 把 不 经 常 使 用 的 区 域 分 配给 经 常 
变化 的 数据 ， 即 试图 平衡 阵列 的 访问 次 数 。 动 态 (dynamic) 损耗 均衡 算法 更 复杂 ， 它 先 监 
控 闪 存 阵列 的 使 用 情况 ， 然 后 在 需要 时 交换 使 用 频 度 较 高 的 数据 块 与 使 用 频 度 较 低 的 数据 块 
的 位 置 。 
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Adapted form M-Systems White Paper, "Two Technologies Compared: 
NOR vs. NAND," July 03 91-SR-012004-8L. Courtesy of SanDisk. 





图 2-34 NOR 和 NAND 闪存 的 比较 





O 闪存 的 自然 属性 意味 着 某 些 位 会 自动 反 转 或 者 存储 位 的 状态 被 错误 地 读 出 ， 此 种 情况 称 为 比特 翻转 (bit- 
人 lipping)。 该 问题 在 NAND 闪存 中 比 在 NOR 闪存 中 更 常见 ， 这 使 得 NAND 闪存 更 适合 多 媒体 业务 ， 因 为 偶 
发 的 位 错误 并 不 会 产生 重要 影响 。 

© TOSHIBA, "NAND vs. NOR Flash Memory Technology Overview." Toshiba America Electronic Components, Inc. 
Irvine. CA. 
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费 者 应 用 中 。1994 +, LMT CF (Compact Flash) 存储 卡 ， 可 以 使 用 户 能 够 将 存储 器 
插入 家 用 基于 个 人 计算 机 的 系统 。 这 些 系统 中 最 重要 的 代表 是 数码 相机 和 MP3 播放 器 。 

CompactFlash 协会 (CFA) F 1995 年 10 月 成 立 ， 以 促进 CompactFlash (CF) 技术， 
并 与 供应 商 一 起 规范 CF 技术 。 

CF 存储 器 是 一 个 相对 较 小 的 部 件 ， 尺 寸 为 43mm x 36mm (1.7 叶 x1.4 oh) BR 
3.3mm (0.13 时 ) 厚 。 其 大 小 约 为 在 第 4 章 中 介绍 的 PC 卡 的 一 半 。 事 实 上 ， 用 户 可 以 为 
CF 卡 购买 非常 便宜 的 PC 卡 适 配器 ， 方 便 将 数码 相机 中 的 照片 复制 到 笔记 本 中 。 前 面 描 
述 的 是 CF 卡 I 型 ， 还 有 5Smm HIM, 

CF 模块 的 优点 是 可 靠 性 高 、 不 易 受 冲击 、 低 成 本 。 它 们 被 设计 成 可 以 支持 双 电 压 标 
准 (5V 和 3.3V)， 这 是 非常 明知 的， 这 使 得 CF 模块 与 现代 的 以 及 旧 的 系统 都 可 以 兼容 。 

除了 实现 闪存 外 ，CF 卡 的 格式 也 针对 其 他 功能 (例如 微型 硬盘 和 如 以 太 网 和 蓝牙 
无 线 适配器 这 样 的 IO 设备 ) 进行 了 调整 。 提 供 诸 如 1O 这 样 的 扩展 功能 的 CF 卡 被 称 为 
CF+ 卡 。 

CF 卡 与 主机 系统 的 接口 使 用 50 针 和 连接， 与 PC 卡 连 接 器 类 似 。CF 卡 到 外 部 系统 的 
接口 并 不 是 简单 的 存储 接口 ( 即 它 由 数据 、 地 址 和 控制 线 构成 )。CF 接口 提供 了 总 线 接 
口 ， 这 意味 着 卡 内 可 以 实现 一 定 程度 的 智能 。 

CF 卡 智 能 控制 器 管理 接口 协议 、 数 据 存 储 和 检索 、 纠 错 码 以 及 诊断 。 接口 使 用 配 
置 寄存 器 和 软件 管理 系统 。 从 主机 系统 的 角度 来 看 ，CF 卡 看 起 来 像 一 个 标准 的 ATA 磁 
##0 (FF IDE). 


meee 


CompactHash _ 
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CF 卡 的 尺寸 与 今天 的 一 些小 型 MP3 播放 器 和 傻瓜 相机 相 比 较 大 ， 所 以 在 1999 年 
出 现 了 称 为 SD (secure digital) 卡 的 新 一 代 闪 存 卡 。 SDHGC 上 不 是 容量 大 于 2GB 的 SDF. 
相应 地 ， 为 诸如 手机 应 用 设计 的 比 SD 卡 更 小 的 微型 SD (micro-SD) 卡 在 2005 年 出 现 。 
SD 卡 比 CF 卡 具有 更 简单 的 事 行 接口 。 eee 








记忆 棒 

Sony 是 二 家 在 时 尚 消费 产品 设 计 领 域 领先 的 公司 。 #1988 年 创建 了 自己 的 可 交换 
存储 器 的 标准 ， 该 存储 器 就 是 记忆 棒 (Memory Stick)。 该 设备 具有 针对 消费 者 市 场 产品 
的 所 有 属性 。 它 结构 紧凑 、 轻 巧 、 便 于 的 带 和 处 理 ， 有 简单 但 可 靠 的 电气 接口 ， 可 以 为 
保护 数据 而 被 设 为 只 读 。 

第 一 代 容 量 高 达 64MB 的 记忆 棒 在 1998 年 推出 。2002 年 ， 最 大 容量 已 增加 到 
512MB， 接 口 升 级 到 20Mb/s。 目 前 的 记忆 棒 可 提供 32GB 的 容量 ， 升 级 的 记忆 棒 
(Memory Stick Pro) 的 容量 高 达 2TB。 然 而 ，Sony 在 2010 年 宣布 支持 SDHC 卡 为 记忆 
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| 棒 的 长 远 未 来 投下 了 阴影 。 

| 为 兼容 基于 PC 的 系统 ， 记 忆 棒 采纳 了 PC FAT 文件 管理 系统 。 然 而 ，Sony 设计 的 

， 记 忆 棒 不 仅 用 于 在 应 用 之 间 传 输 数据 ， 还 为 了 控制 受 版 权 保 护 的 数据 流动 。 音 乐 和 电影 
| 产业 公司 极 大 地 受益 于 互联 网 和 新 技术 ， 因 为 它们 有 助 于 扩大 市 场 。 同 样 ， 音 乐 产业 对 
| 媒体 的 作用 不 满意 ， 因 为 大 规模 互联 互通 与 数字 技术 使 音频 和 视频 文件 可 以 在 没有 质量 
损失 的 情况 下 任意 复制 。Sony 采用 MagicGate 技术 与 记忆 棒 配 合 ， 以 禁止 未 经 授权 的 数 

| BBIE, MagicGate 版 权 保护 包括 两 种 技术 : 确定 设备 是 否 合法 地 支持 MagicGate HH 
| 份 验证 (authentication) 技术 ,以 及 保护 合法 内 容 的 加 密 (encryption) 技术 。 a 

| E MagicGate 生成 的 独一无二 的 ID 号 。 

”与 闪存 卡 的 并 行 接口 不 同 ， a a ee 串 行 接口 的 优点 
是 简单。 记忆 棒 只 提供 10 个 接口 引 脚 ， 包 括 为 未 来 扩展 的 引 脚 。 这 么 简单 的 接口 使 得 
| 它 更 容易 具有 轻薄 的 外 形 。 这 对 小 型 个 人 设备 来 说 是 重要 的 ， 可 以 确保 接口 的 机 械 可 对 
| 性 且 不 会 出 现 由 于 频繁 拔 宪 导致 的 断 续 接触 问题 。 

| “记忆 棒 由 Flash EPROM 构成 ， 由 串 行 接口 控制 器 管理 存储 ， 并 具有 MagicGate 版 权 
| 保护 机 制 。 该 控制 器 提供 了 闪存 的 接口 ， 可 以 进行 修改 以 适应 不 断 出 现 的 新 存储 技术 。 
Vo OI Be SET ticles she 28 eer 
| 个 信号 为 ， 
| ‘SCL (EAA) 






SDIO 人 六 入 和 下 在 入 的 介 见 取 和 errs) 
o (RARAN > za 
主机 总 是 通过 SCLK 和 BS ents 与 记 | Finis 号 SDIO 传输 包 
& CRC 人 po 据 传输 开始 。BS 也 用 


种 类 型 : -o r = 
== 操作 
BS0 中 断 一 -没有 数据 传输 

BSI 传输 控制 协议 状态 一 一 从 主机 拷贝 TCP 到 记忆 棒 

BS2 写 协议 的 数据 传输 状态 ; 将 数据 传输 到 记忆 棒 。 读 协议 的 握手 状态 。 等 待 RDY 信号 就 绪 
BS3 写 协议 的 握手 状态 ;等待 RDY 信号 就 结 。 读 协 议 的 数据 传输 状态 。 HCA RS 


在 状态 BS! 对 传输 协议 控制 命令 进行 传输 ， 在 BS2 和 BS3 kA, 2 


OO ， 
| OO 由 于 信息 








[ 对 数据 传输 进行 优化 是 无 意义 的 ， BRR: p3 | HR 
”用 文件 分 配 表 ( FAT) 机 制 以 PC 兼容 的 格式 存储 。 然 而 ， Sony CHM T UNE 
| 影音 文件 格式 ， 预 定义 了 与 这 些 应 用 兼容 的 目录 管理 机 制 。 


2.5 ”新 兴 的 非 易 失 性 技术 
本 节 将 介绍 一 些 非 易 失 性 存储 系统 的 新 兴 技 术 。 某 些 技术 还 处 于 早期 研究 阶段 ， 有 些 
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RAGA MP th. AAS A i Pm HEAR: Aw (ferroelectric) RAM 和 奥 氏 双向 
(Ovonic) 存储 器 。 

铁 电 RAM 又 称 FRAM， 是 一 种 半导体 非 易 失 性 存储 器 的 形式 ， 在 20 世纪 90 年 代 开 始 
出 现 。 虽 然 单词 “ ferroelectric” 的 前 级 “ ferro ”通常 表示 与 铁 磁 相 关 ， 实际 上 FRAM 有 点 
名 不 符 实 ， 它 与 磁 技 术 无 关 。DRAM 的 原理 是 向 某 种 材料 充电 从 而 保存 电场 。 磁 盘 和 磁带 
系统 是 在 记录 介质 上 记录 磁化 方向 的 连续 排列 从 而 达到 保存 磁场 的 目的 。FRAM 通过 在 晶 格 
中 移动 某 个 原子 来 改变 极 化 (polarization) 从 而 实现 数据 保存 。 

铁 电 效应 描述 了 材料 在 没有 电场 的 情况 下 保存 极 化 的 能 力 ， 使 用 该 术语 的 原因 是 因为 其 
与 磁性 材料 能 够 在 没有 磁场 的 环境 下 保存 磁场 的 能 力 类 似 。 

为 了 理解 铁 电 效应 ， 必 须 首先 理解 材料 的 几 个 简单 属性 。 材 料 可 以 分 为 两 类 : 导体 和 绝 
缘 体 。 它 们 之 间 的 区 别 是 电子 可 以 在 导体 中 自由 移动 而 不 能 在 绝缘 体 中 移动 。 如 果 向 导体 
(例如 铜 ) 施加 电场 ， 则 导体 中 的 电子 将 在 电场 的 影响 下 移动 。 如 果 将 绝缘 体 放 入 电场 ， 电 
子 不 能 在 绝缘 体 中 移动 。 然 而 ， 电 场 确实 对 组 成 绝缘 体 的 分 子 产生 了 影响 ， 它 扰乱 了 绝缘 体 
分 子 结构 中 正 负电 和 荷 的 均匀 分 布 。 这 种 在 电场 的 影响 下 导致 电子 和 原子 核 位 置 发 生 改 变 的 情 
况 被 称 为 极 化 。 

图 2-35 和 图 2-36 显示 了 电场 对 单个 原子 的 影响 。 图 2-35 中 ， 带 有 负电 荷 的 电子 围绕 带 
有 正 电 荷 的 原子 核 旋转 ,原子 电荷 的 平均 分 布 为 零 ， 这 是 由 于 正 负电 荷 相 互 抵消 。 图 2-36 
中 ， 施 加 的 电场 使 得 对 称 性 被 改变 。 围 绕 原 子 核 的 电子 云 (electron cloud) 的 平均 位 置 的 改 
变量 由 电场 的 强度 决定 ， 此 时 原子 获得 了 兆 电 荷 Cnet electric charge)。 图 2-37 显示 了 原子 
可 以 被 看 成 一 个 双 极 子 ( dipole)， 它 有 两 个 电极 (这 也 是 极 化 这 个 术语 的 由 来 )。 双 极 子 的 
电 行 为 可 以 看 成 磁性 的 相似 体 。 












电场 
围绕 原子 核 

旋转 的 带 有 负 ”= = 
电荷 的 电子 去 “名 
带 有 正 电荷 的 原子 核 和 外 界 电场 8 
$ 改变 了 电子 $ 
oy Bi © 

图 2-35 单个 原子 的 结构 图 2-36 电场 对 单个 原子 的 作用 


通过 电场 极 化 后 的 原子 
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图 2-37 电场 中 的 原子 表现 出 极 化 


正如 磁性 表现 为 从 北 至 南 排列 那样 ， 双 极 子 也 表现 为 从 正极 到 负极 葛 排 列 志 如 图 238 
所 示 。 二 串 双 极 子 可 以 看 成 一 个 具有 更 强 能 量 的 双 极 子 ， 如 图 2-39 所 示 。 在 电场 中 的 绝缘 
体 产 生 了 双 极 子 ， 它 就 被 称 为 电介质 (dielectric) o 绝缘体 极 化 的 强度 用 电 介 常 数 (dielectric 
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constant) 来 表示 ， 可 以 用 真空 中 的 电 介 常 数 来 理解 。 从 本 书 的 观点 来 看 ， 极 化 材料 最 重要 
的 效果 是 其 可 以 用 来 保存 数据 。 


© 00 00 00 00 00 © 


图 2-38 双 极 子 的 排列 
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Fl 2-39 ” 双 极 子 排列 的 体 效 应 (bulk effect) 


FRAM 是 铁 电 效应 的 实际 应 用 。 通 过 在 微小 的 电容 中 使 用 铁 电 薄膜 来 保存 数据 。 铁 电 薄 
膜 根据 被 施加 电场 的 方向 而 被 极 化 为 两 个 方向 之 一 。 

铁 电 技术 在 20 世 纪 60 年 代 早期 由 Stanford 大 学 首 
EH, SYW 等 人 于 1974 年 研究 了 铁 电 材料 和 半 导 
体 技术 如 何 结合 起 来 使 用 。1988 年 ，Ramtron 国际 公司 
宣布 了 第 一 款 商 用 的 铁 电 随机 访问 存储 器 (FRAM)。 

在 FRAM 中 使 用 的 铁 电 材 料 属 于 为 钙 钦 结构 
( peroviskite) 这 一 类 晶体 。 图 2-40 显示 了 钙 钛 晶体 的 
结构 ， 其 化 学 表达 式 为 ABO;， 其 中 O 代表 氧 原 子 ，A 
和 B 原子 决定 了 特定 的 钙 詹 晶体。 例如， 一 种 常见 的 图 2-40 钙 铁 晶体 的 结构 
BRE ADB A i RIB SG PZT (lead zirconate titinate)， 它 是 PbZrO; 和 PbTiO, 的 混合 物 。 

图 2-41 显示 了 电场 对 钙 铁 晶体 的 影响 。 当 施加 电场 时 ， 晶 体 中 心 的 原子 CAA PAB 
或 钛 原子 ) 进入 两 种 稳 态 中 的 一 种 。 这 就 是 铁 电 钙 钛 晶体 保存 数据 的 机 制 。 


电场 方向 
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b) 状态 1 
图 2-41 电场 对 钙 钛 晶体 的 作用 


2.5.1 GRAB 


考虑 在 两 个 金属 板 间 夹 着 -一片 铁 电 材 料 的 系统 ， 如 图 2-42a 所 示 。 假 设 在 电介质 两 端 施 
加 电压 使 之 极 化 ， 如 图 2-42b 所 示 。 移 除 电压 后 ， 对 电介质 的 极 化 不 会 产生 影响 ， 如 图 2-42b 
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所 示 。 同 样 ， 在 金属 板 间 施 加 一 个 小 的 无 论 是 哪个 方向 上 的 电压 ， 都 不 会 产生 整体 影响 。 


如 果 在 板 间 的 电压 逆转 ， 并 增加 其 强度 ， 如 
图 2-42c 所 示 。 电 介质 的 极 化 方向 将 发 生 改 变 ， 材 | 


料 的 状态 发 生变 化 。 当 铁 电 材 料 中 的 原子 大 晶体 的 
一 端 移动 到 另 一 端 以 至 于 被 检测 到 时 ， 则 出 现 脉冲 





电流 。 人 们 无 法 检测 到 这 些 设备 到 底 处 于 哪 种 状态 。 ， AHR ne Oe 
或 者 极 化 方向 ,但 可 以 检测 其 是 否 改变 了 状态 ， 即 = ite 
FRAM 存储 器 具有 破坏 性 读 出 。 


图 2-42d 中 , 电源 再 次 被 移 除 ， 铁 电 材 料 保持 El -二 ae 
其 中 的 电荷 。 此 时 已 拥有 存储 器 需要 的 一 切 : 人 迫使 Ca | CE | 


材料 进入 两 种 状态 之 一 的 方法 ,以 及 通过 在 两 端 施 c) 电压 逆转 ， 材 d) 电源 移 除 后 
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加 电压 来 检查 其 处 于 哪 种 状态 的 方法 。 料 的 极 化 方向 反 转 。 ”电荷 仍然 保持 ,但 
实用 的 FRAM 位 元 使 用 稍 加 修改 的 DRAM 技 方向 与 b 不 同 
术 构 建 。 刚 才 介绍 了 通过 向 铁 电 材料 充电 可 以 实现 图 242“ 铁 电 存储 


将 数据 写 人 FRAM 位 元 。 为 了 读 取 存储 位 元 中 的 数据 ， 选 中 该 晶体 管 ， 然 后 施加 电场 穿 过 
电容 。 如 果 位 元 已 经 被 极 化 为 与 电场 一 致 的 方向 ， 则 什么 都 不 会 发 生 。 然 而 ， 如 果 位 元 是 反 
向 充电 的 ， 则 开关 晶体 管 中 有 电流 流 过 。 

FRAM 4 #4 100ns 的 时 间 内 改变 状态 ， 这 上 比 一 些 传统 的 半导体 非 易 失 性 存储 器 (如 
EPROM) 的 速度 要 快 ， 但 比 SRAM 3È DRAM 的 要 慢 。 读 FRAM 位 元 的 动作 当然 是 破坏 性 
的 ， 这 是 由 于 数据 是 通过 位 元 改变 了 、 还 是 没有 改变 来 检测 的 。 因 此 ， 铁 电 存储 器 读 周期 后 
往往 接着 一 个 写 周期 来 写 回 数据 ， 原 来 保存 的 数据 可 能 改变 也 可 能 没有 改变 。 

K 2-4 比较 了 半导体 非 易 失 性 存储 器 技术 和 FRAMs 不 幸 的 是 ， 许 多 非 易 失 性 存储 机 
制 ， 包 括 FRAM， 其 改变 状态 的 次 数 往往 受 限 。 基 于 PZT 的 铁 电 材 料 具 有 优良 的 性 能 ， 极 
化 程度 高 ， 易 于 批量 生产 。 但 它 具有 被 称 为 疲劳 (fatigue) 的 现象 ， 这 限制 了 写 周 期 的 数量 。 
较 新 的 材料 ， 如 SBC( 即 SrBi,Ta,0, )， 可 极 化 超过 10” 次 而 不 会 疲劳 。 为 了 取代 传统 的 易 
失 性 RAM (如 FRAM 这 样 的 设备 )， 需 要 具有 10” 个 周期 的 生命 周期 。 

表 2-4 FRAM 与 其 他 存储 器 的 比较 


FRAM | EEPROM | me | EPROM | 接 模 ROM | DRAM | 
10 年 


| 
PL avi ee a aay | 


| 


| 180ns | 每 字 节 10ns | 每 遍 区 1s | 每 守节 05ms| 一 | 
不 必要 必要 (FG | MBE OK | RE (RES 
擦 除 ) 擦 除 ) HER) 
batt | 0 ee 
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FRAM 存储 器 不 需要 承受 EPROM 中 常见 的 高 水 平 电 应 力 使 电荷 通过 绝缘 体 。 EPROM 
在 门 极 附 近 用 于 保存 电荷 的 绝缘 材料 容易 出 现 灾难 性 故障 。FRAM 的 另 一 个 优点 是 它 的 耐 辐 
射 性 (radiation hard)， 即 它 受 高 能 电离 辐射 的 影响 比 某 些 半导体 器 件 的 影响 要 小 ， 因 此 其 更 
适合 于 卫星 等 在 恶劣 环境 下 的 应 用 。 从 用 户 的 角度 看 ，FRAM 的 实际 优点 是 ， 它 结合 了 闪存 
与 DRAM 的 优点 。 目 前 的 闪存 仍然 是 一 种 大 部 时 间 为 读 的 存储 器 技术 ， 而 FRAM 的 写 操 作 
次 数 可 以 比 闪存 提高 7 个 数量 级 。 

到 2008 年 ，FRAM 已 经 走 过 了 很 长 的 路 ，Ramtron 国际 公司 因 其 FM22L16 4M 的 
FRAM 存储 器 -( 组 织 为 256K x16 非 易 失 性 RAM) 而 荣获 中 国电 子 产 品 年 度 产 品 奖 。 它 的 访 
问 时 间 为 55ns， 它 的 周期 时 间 为 110ns。 其 电气 特性 与 行业 标准 的 SRAM 兼容 。 这样 ， 可 
以 简单 地 将 现 有 的 SRAM 替换 为 非 易 失 性 FRAM 而 不 需要 修改 硬件 。 

图 2-43 和 图 2-44 给 出 了 FRAM 读 写 周期 的 时 序 图 。 低 电 平 有 效 的 CE1 信号 和 高 电 平 
有 效 的 :CE2 信号 必须 出 现在 读 或 写 周期 开始 。19 位 地 址 从 As 一 Aco 输入 ， 相 关 输入 /输出 
信号 由 DQi; ~ DQw 给 出 。 这 些 图 没有 什么 特殊 之 处 ， 即 它们 与 其 他 半导体 SRAM 的 读 写 
周期 非常 相似 。 






DQ(15:0) 
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图 2-44 FRAM 写 周期 时 序 图 (RAMTRON FM23MLD16512K x16) ， 


2.5.2 MRAM 一 一 磁 阻 随机 访问 存储 器 
磁 阻 随机 访问 存储 器 ( Magnetoresistive RAM, MRAM) 利用 了 物质 的 电磁 特性 。 就 像 
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其 他 某 些 现代 技术 那样 ,其 未 来 尚 不 确定 ， 净 其 是 因为 它 正 与 其 他 的 非 易 失 性 :SRAM 构成 
竞争 。 第 二 款 商业 化 MRAM 存储 器 是 由 Freescale 公司 在 2006 年 推出 的 一 种 4Mb 的 设备 。 

MRAM 具有 与 半导体 静态 存储 器 类 似 的 访问 时 间 (5 ~ 40ns) 以 及 10ns 的 写 和 人 时间。 
SAAR, MRAM 位 元 可 以 不 受 次 数 限制 地 进行 写 操作 。 事 实 上 ，MRAM 具有 许多 (与 
其 竞争 技术 相 比 ) 近乎 完美 的 存储 器 的 特性 。~ 

图 2-45 展 示 了 MRAM 存 储 器 元 件 的 组 成 ， 包 括 一 个 磁 隧 道 结 (magnetic tunnel 
junction, MTJ) 结构 5 MTJ 由 3 层 组 成 : 氧化 层 (氧化 镁 MgO) 夹 在 两 个 磁 层 :( 硼 铁 化 外 
CoFeB) 之 间 s。 其 中 一 个 磁 层 是 固定 的 ( 即 内 部 磁场 的 方向 不 会 改变 )， 另 一 个 磁 层 可 自由 旋 
转 其 磁化 方向 ， 如 图 2-45 上 层 中 的 双 箭头 所 示 s 氧化 层 很 薄 ， 为 1.2nm 左右 。 


位 线 BL 







,为 平行 状态 
Rap 为 反 平 行 状态 


S 
È 
WS 
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2-45 MRAM 单元 


自由 层 的 磁化 方向 可 以 在 与 底层 平行 和 反 平 行 之 间 进 行 切换 。 切 换 自 由 磁 层 磁化 方向 执 
行 的 操作 是 通过 使 电流 通过 靠近 MRAM 位 元 的 写 线 来 完成 。 线 路 中 电流 生成 磁 层 所 需 的 磁 
场 。 当 两 层 的 磁化 方向 相同 ， 位 元 具有 低 电阻 ( 即 沿 图 2-44 中 位 线 BL 的 方向 )， 当 磁化 是 
反 平行 的 ， 其 电阻 较 高 。 可 以 很 容易 地 测量 位 元 中 的 电阻 ， 并 可 以 用 其 代表 二 进 制 状态 。 此 
外 ， 存 储 器 位 元 不 像 FRAM 那样 是 破坏 性 读 出 的 。 在 下 一 章 中 ,我 们 将 利用 该 技术 讨论 硬 
盘 驱动 器 的 磁头 。 然 而 截至 2011 年 年 底 , MRAM 技术 才 开始 形成 商业 化 产品 。 以 其 高 速 、 
有 效 而 不 限 次 数 的 读 / 写 周期 ;* MRAM 宣称 提供 适合 所 有 需求 的 通用 存储 器 部 件 ( 除 了 高 速 
Cache). 


2.5.3 双向 存储 器 


材料 的 另 一 种 可 以 用 来 存储 信息 的 特性 是 相 (phase)s :双向 (Ovonic) 存储 器 利用 薄膜 
材料 的 相 变 来 存储 数据 。 该 相 变 是 可 逆 的 ， 因 此 存储 位 元 可 被 擦 除 和 改写 。 双 向 材料 要 人 么 处 
于 结构 化 的 最 态 (crystalline)， 要 么 处 于 无 组 织 (amorphous) 非 结 构 化 的 非 晶 态 。 具 有 适宜 
相 变 特性 的 一 类 材料 是 硫 系 (chalcogenide) 玻璃 ， 它 由 Bell 实验 室 的 Ovshinsky 在 1968 年 
首次 发 现 s 

如 果 将 硫 系 玻璃 熔化 并 快速 冷却 , “ERE A aE da (amorphous phase). 如 果 它 慢 慢 地 
被 加 热 到 略 低 于 其 熔点 的 温度 ， 非 晶 态 材料 将 恢复 到 其 初始 的 晶 相 《〈crystalline phase). 非 
晶 材 料 的 特点 是 原子 短程 有 序 ， 具 有 高 反射 率 和 高 电阻 ; 而 多 晶 材 料 的 特点 是 原子 长 程 有 
序 ， 具 有 低 反 射 率 和 低 电 阻 。 

由 于 双向 材料 处 于 两 种 状态 时 其 电阻 有 四 十 倍 的 差异 ， 因 此 可 以 用 来 记录 数据 。 在 下 一 
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BH, 将 介绍 相 变 机 制 也 可 以 被 用 于 光 存 储 系统 ， 例 如 可 重 写 的 CD 和 了 DVD。 因为 硫 属 化 
物 可 以 制 成 薄膜 ， 它 可 以 结合 在 半导体 单元 中 ， 使 得 双向 存储 器 可 以 像 其 他 的 半导体 存储 器 
那样 构建 。 

与 闪存 不 同 ， 相 变 存储 器 可 以 按 位 组 织 (bit organized) 使 得 每 一 位 都 可 以 被 重 写 。 闪存 
是 按 抉 组 织 的 ， 所 以 在 更 改 信息 前 需要 擦 除 整 个 块 ( 扇 区 )。 双 向 存储 器 是 静态 的 ， 不 需要 
刷新 ， 数 据 的 读 出 也 是 非 破坏 性 的 。 通 过 控制 向 存储 位 元 中 写 数据 的 电流 脉冲 的 振幅 ， 可 以 
在 多 个 非 晶 态 (或 非 唱 度 ) 做 出 选择 一 一 每 个 状态 都 有 不 同 的 电阻 ; 因此， 双向 在 储 器 可 以 
是 多 位 存储 位 元 ( 即 每 个 位 元 可 以 存放 多 个 位 ) 的 候选 项 ,将 促进 位 7 芯片 密度 的 提升 3 

双向 存储 单元 能 够 承受 10” 次 改写 而 不 发 生 退 化 ， 还 可 以 通过 不 同 程度 的 相 变 来 存储 多 
“ME (类 似 MLC 闪存 技术 )。 双 向 存储 器 的 主要 优点 是 稳定 性 。 在 正常 的 操作 温度 下 ， 据 估 
计 ， 存 储 单元 的 内 容 将 保持 稳定 超过 300 年 。 同 样 ， 从 读 写 次 数 的 角度 来 说 ， 相 变 设备 的 预 
期 寿命 比 闪存 单元 的 要 长 。 

闪存 、DRAM 以 电荷 的 形式 存储 数据 很 容易 受 电离 辐射 的 影响 ， 这 妨碍 它们 在 一 些 环 
境 和 军事 上 的 应 用 。 相 变 存储 器 设备 具有 固有 的 耐 辐射 特性 。 

双向 存储 器 技术 需要 关注 的 二 个 问题 是 它 的 可 扩展 性 (scalability) : 设备 可 以 被 越 做 越 
小 吗 ? 由 于 存储 位 元 需要 加 热 装 置 来 改变 双向 物质 的 状态 ， 减 小 位 元 的 大 小 会 不 会 导致 热 
量 改 变 其 邻居 位 元 的 状态 ?幸运 的 是 ， 材 料 中 热流 量 的 理论 计算 表明 ， 热量 可 以 随 着 规模 减 
小 。 即 ， 当 位 元 变 得 更 小 时 ， 位 元 之 间 的 热流 量 也 会 减少 ， 因 此 可 扩展 性 不 是 问题 。 

2009 年 6 月 ，Samsung 电子 宣布 与 Numonyx (Numonyx E A 2008 4 F tf tl i 90nm 
128Mb 的 PRAM， 但 规模 较 小 ) 共同 开发 的 相 变 存储 器 。2009 49H, Samsung 宣布 它 已 
经 开始 制造 针对 移动 电话 市 场 的 60nm512Mb 的 PRAM., 2009 年 10 H, Numonyx 展示 了 在 
硅 片上 垂直 堆 琶 多 个 相 变 存 储 器 阵列 的 能 力 ， 并 打算 使 用 45nm 技术 生产 容量 为 Gb 量 级 的 
PRAM。 来 自 Numonyx 的 表 2-5 说 明了 2010 年 相 变 存储 器 与 其 他 存储 技术 相关 参数 的 比较 


表 2-5 PCM 与 其 他 存储 机 制 的 比较 


高 密度 存储 器 技术 的 比较 
EIRE a o 
wat |i T 
we nm 
me | swe ET 
sae a ice 200 ~ 40008 
p [anrs A 10 


wae [Boman Flin 
met | sin A oms 
hH 约 0.1nJ/b DNF int ”| 大 于 10nJ/b 
SWR | Awas 1 10W 
wae | ee 
永久 


©. S. Eilert, M. Leinwander and B. Crisenza, “Phase Change Memory (PCM): A new memory technology to enable new 
memory usage models.” Micron Technology Inc, June 2011. 
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忆 阻 器 i 

最 奇怪 的 潜在 存储 设备 是 忆 阻 器 ( memristor, KAEM), 它 在 1971 WE 
出 。Leon'Chua 研究 了 电 下 理论 中 的 3 个 经 并 无 尖 元件: OM. CARER, WARR 
存在 第 四 种 元 件 : 记忆 电阻 。 Sa, ee TS 


















Frente 30 多 年 后 ， ,HP 的 Stanley Williams 在 2008 ise chee ims 
原型。 二 上 化 人 TiO) FEARR (AAD) AABE, 





7 HORT ORS. MEA DAH ARAR, RAM 
ERA ih fe RBA TO, 构成 的 三 明治 )。 给 薄 的 二 氧化 钛 薄膜 施加 电 
RE A ae 
电场 的 持续 时 间 和 强度 2 。 2 
6 Aine diem Oe ae al eR RN eRe 
Re Se be cer Sst ee a a PO 
RAM, MRAM 或 者 双向 存储 器 仍 有 竺 观察。 然而 ， 近 年来， 出 现 了 一 些 其 他 形式 的 忆 
mE. ne, ant 似 氧化 牧 特 性 的 材料 【如 某 些 聚合 物 济 腊 )。 同 衬 人 们 对 
TABS IME ATA, WOT AR, 人 们 志 要 需要 新 的 非 














RR, 这 是 因为 内 存 技术 似 竹 印 将 达到 其 密度 福 隐 





本 章 小 结 


存储 器 是 计算 机 世界 的 “ 灰 姑 娘 ”。 许 多 计算 机 用 户 都 知道 Intel 处理 器 和 AMD 处 理 器 
之 间 的 差异 ,但 他 们 可 能 不 会 鉴别 例如 Rambus DRAM! DDR3 DRAM 和 SDRAM 之 间 的 
差异 。 同 样 ， 他 们 可 能 没有 意识 到 存储 器 系统 设计 的 趋势 和 新 的 非 易 失 性 存储 器 日 益 重 要 的 
作用 。 

然而 ， 没 有 存储 器 ， 世 界 上 所 有 的 快速 CPU 都 是 无 用 的 ， 除 非 作 为 设备 来 计算 出 r 值 
小 数 点 后 的 数 千 位 。 今 天 ， 多 媒体 应 用 所 需 的 数据 无 休止 地 增长 导致 了 对 巨大 存储 容量 的 需 
求 。 此 外 ， 手 机 和 移动 应 用 需要 低 功 耗 的 存储 器 ，MP3 播放 器 和 数码 相机 需要 非 易 失 性 存 
储 器 。 

本 章 介绍 了 构建 立即 访问 存储 器 部 件 的 相关 技术 和 组 织 。 与 处 理 器 技术 相 比 ， 半 导体 存 
储 器 更 容易 受到 速度 、 价 格 和 性 能 之 间 权 衡 的 影响 。 非 易 失 性 存储 器 可 以 在 关闭 计算 机 时 保 
存 数据 ， 但 需要 在 将 数据 写 人 存储 器 时 花费 很 长 的 时 间 。DRAM 的 成 本 低 、 密 度 高 ， 但 其 
访问 时 间 比 SRAM 的 要 长 ， 而 且 需 要 更 复杂 的 逻辑 控制 。SRAM 速度 快 、 易 于 使 用 ， 但 它 
比 DRAM 更 昂贵 、 密 度 更 低 。 

本 章 还 介绍 了 3 种 新 的 存储 技术 : FRAM, MRAM 和 双向 存储 器 。 这 表明 工程 师 们 在 
不 断 地 寻求 那些 能 保持 两 种 电 状 态 从 而 可 以 用 来 存储 数据 的 材料 。 


© Strukov, Snider, Steward, Williams, “The missing memristor found,” Nature, Vol. 453,1 May 2008, pp. 80-83. 
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习题 

2.1 FIAR ( 当 应 用 于 存储 系统 中 ) 的 含义 是 什么 ? 
a: 随机 访问 ; b. BTA; c. SRAM; d. DRAM; 
e. 非 易 失 性 存储 器 f. 访问 时 间 ; ` g. 大 部 时 间 为 读 存 储 器 ; h. 周期 时 间 


22 


2.3 
2.4 


2a 


2.6 


2.7 


2.8 


2.9 


计算 机 具有 1MB 的 存储 空间 。 

a: 假 设 该 空间 按照 字 节 编 址 ， 它 需要 有 多 少 根 地 址 线 来 寻 址 ? 

b: 如 果 该 计算 机 有 16 位 的 数据 总 线 ， 可 以 访问 字 节 和 .16 位 的 字 ， 试 给 出 用 来 选择 字 节 / 字 的 
方式 。 

c. 该 计算 机 存储 器 容量 为 512KB ， 每 个 字 32 位 ， 如 果 使 用 64Kb 的 SRAM 芯片 、 每 片 4 位 宽 ， 需 
BB/D RAM 芯片 来 实现 该 存储 器 ? 

某 存储 器 部 件 的 地 址 范围 从 0x00400000 到 0x007FFFFF。 其 容量 是 多 少 ? 

Fikk (memory hierarchy) 的 含义 是 什么 ， 为 什么 它 对 PC 和 类 似 工 作 站 的 设计 者 来 说 是 个 非 
常 重要 的 概念 ? 

本 章 开始 时 指出 ， 存 储 器 的 易 失 性 和 只 读 性 是 二 组 了 矛盾。 然而， 在 某 个 应 用 场合 下 ， 易 失 性 只 读 
存储 器 会 非常 有 用 。 你 能 想到 该 种 应 用 场合 吗 ? 

设计 师 可 以 使 用 两 种 不 同 的 静态 存储 设备 来 构造 具有 16 位 CPU 的 计算 机 。 两 种 存储 芯片 都 可 以 
容纳 2” 位 。 如 果 需 要 构建 16 位 数据 总 线 和 128MB 存储 容量 的 计算 机 ,存储 芯片 要 么 是 256K 个 
16 位 的 字 组 成 ， 要么 是 4M 个 1 位 的 字 组 成 。 哪 种 方案 可 以 实现 更 为 紧凑 的 存储 系统 ? 提示: 考 
察 单个 芯片 的 引 脚 数 。 

某 公 司 在 2012 年 设计 了 一 台 计 算 机 。 假 定 在 其 发 布 时 ， 存 储 器 速度 是 CPU 速度 的 两 倍 。 据 估算 ， 
CPU 速度 每 年 提高 20%。 同 样 ， 据 估算 ， 存 储 器 速度 每 年 提高 10%。 问 多 少年 后 CPU 将 必须 等 

待 存储 器 提供 数据 ? 

为 什么 所 有 的 ROM #8 RAM, 但 不 是 所 有 的 RAM 都 是 ROM ? 为 什么 SRAM E DRAM 更 适合 
于 构造 Cache ? 

试 述 当 前 最 先进 最 高 性 能 的 个 人 计算 机 的 主 存储 器 、Cache 和 硬盘 的 典型 容量 是 多 少 ? 


2.10 一 个 静态 存储 位 元 至 少 需 要 4 个 晶体 管 、 一 个 DRAM 位 元 可 以 使 用 一 个 晶体 管 来 保存 一 位 数据 。 


存储 器 可 以 以 少 于 每 位 一 个 晶体 管 的 方式 来 保存 数据 吗 ?你 能 给 出 一 种 一 个 晶体 管 存储 多 位 数据 
的 机 制 吗 ? 


2.11 来 自 某 商业 SRAM 数据 表 的 时 序 图 如 图 P2.11 所 示 ， 口 头 解 释 其 过 程 。 


RESTR 
时 名 NAS 





地 址 


_ 片 选 
CS 或 SS 
写 使 能 
(WE) 
输出 使 能 
(OE) 


数据 输出 : : : 
aS : XX {D0 X iver X ipe 


图 P2.11 SRAM 的 时 序 图 
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2.24 


2.25 
2.26 


2.27 
2.28 


2.29 


SRAM il DRAM 的 基本 区 别 是 什么 ? 为 什么 DRAM 要 比 相 同 大 小 ( 即 按 位 计算 的 容量 ) 的 
SRAM 的 引 脚 (IO 连接 数 ) 要 少 ? 

传统 DRAM 中， 列 地 址 和 行 地 址 选 通信 号 的 作用 是 什么 ? 在 DRAM 时 序 中 ,， 伪 最 大 值 
(pseudomaximim) 的 含义 是 什么 ? 哪个 DRAM 参数 是 伪 最 大 值 ? 对 于 设计 工程 师 来 说 伪 最 大 值 
的 含义 是 什么 ? 

双向 存储 器 和 铁 电 存储 器 之 间 的 差异 是 什么 ? 

实现 存储 系统 所 需 材 料 的 基本 特性 是 什么 ? 你 可 以 想到 一 些 尚 未 利用 ` 但 可 以 用 来 构建 未 来 存储 
系统 的 材料 特性 并 给 出 构建 方式 吗 ? 

PC 中 某 DDR SDRAM 模块 的 时 钟 频率 为 133MHz， 并 连接 到 64 位 的 数据 总 线 。 用 存储 系统 的 
PCxx00 标准 来 命名 ， 其 名 称 是 什么 ? 

DRAM 的 速度 每 年 增长 约 7%， 而 处 理 器 的 性 能 每 年 提高 约 60%。 短 期 内 这 种 状况 的 后 果 是 什 
么 ? 长 期 的 后 果 又 怎样 ? 

某 微 处 理 器 芯片 有 16 位 的 数据 总 线 ， 即 它 只 执行 16 位 的 读 和 写 操作 。 使 用 该 处 理 器 和 两 个 8 位 
存储 器 部 件 可 以 构造 一 个 最 小 计算 机 系统 。 不 幸 的 是 ， 现 在 只 有 一 个 8 位 的 存储 器 部 件 ， 这 意味 
着 不 能 直接 建立 一 个 完整 系统 。 你 有 办 法 吗 ? 请 说 明 你 如 何 使 用 一 个 16 位 的 处 理 器 和 一 个 8 位 
的 存储 部 件 构建 一 个 完整 的 系统 。 

某 计 算 机 具有 24 位 的 地 址 总 线 ， 使 用 具有 F=A,, An" 40 功能 的 逻辑 电路 来 选择 某 个 
存储 部 件 。 通 过 该 电路 译 码 能 够 访问 的 存储 地 址 范围 是 多 少 ? 

某 计 算 机 具有 64 位 的 数据 字 和 32 位 的 地 址 。 通 过 4 个 体 进 行 交叉 。 存 储 总 容量 为 1024MB。 给 
出 处 理 器 的 32 位 地 址 是 如 何 划 分 的 〈 即 如 何 划 分 为 4 个 域 ) ? 

某 DDR3 DRAM 被 表示 为 9-9-9-24。 这 是 什么 意思 ? 

某 计 算 机 具有 64 位 的 数据 总 线 ， 使 用 以 下 存储 芯片 。 每 种 情况 下 ， 芯 片 表示 为 位 置 数 x 数据 宽 
Es 对 于 每 一 种 芯片 ， 说 明 所 需 的 最 小 芯片 数 以 及 相应 的 存储 容量 。 

a. 4M x 1; b.1Mx4; ~ 6. 256K x 16 

如 果 可 以 在 DRAM 芯片 中 包含 Cache， 你 将 如 何 组 织 它 ， 可 以 获得 什么 优势 ? 对 计算 机 系统 结 
构 可 能 会 带 来 什么 样 的 变化 ? 

RA Sh ee Hl AR LAT 20 位 的 地 址 总 线 ， 可 以 访问 以 下 4 个 内 存 块 。 试 画 出 地 址 译 码 表 以 满足 
以 下 存储 映射 ， 并 设计 地 址 译 码 器 来 选中 这 些 设 备 。 

a.RAM1 0 0000 一 3 FFFF 

b. RAM2 4 0000 一 7 FFFF 

c. ROM1 E 0000 一 E 7FFF 

d. ROM2 F 0000—F FFFF 

什么 是 损耗 均衡 ， 为 什么 需要 这 样 做 ? 

某 CPU 具有 24 位 的 地 址 总 线 和 16 位 的 数据 总 线 ， 可 以 访问 以 下 内 存 块 : 使 用 256K x 8 位 芯 
构成 的 1MB ROM 以 及 使 用 2M x 4 位 芯片 构成 的 8MB DRAM。 试 设计 一 个 地 址 译 码 器 来 实现 这 
样 的 安排 。 

据 报道 ， 闪 存 的 密度 将 达到 极限 。 如 果 是 这 样 ， 你 有 什么 考虑 ? 

如 果 需 要 为 深 空 飞行 器 设计 计算 机 。 需 要 考虑 哪些 特殊 因素 ， 这 对 计算 机 的 设计 会 产生 什么 
影响 ? 

图 P2.29a 给 出 了 微 处 理 器 写 周期 的 时 序 图 。 图 P2.29b 给 出 了 存储 器 映射 的 外 设 写 周期 的 时 序 
图 。 利 用 表 P2.29 中 的 时 间 信 息 ， 验 证 图 P2.29 接口 功能 的 正确 性 。 注 意 ， 存 储 器 映射 的 外 设 在 
处 理 器 看 来 就 像 SRAM 一 样 访问 (第 4 章 将 介绍 这 种 外 设 )。 本 题 中 ， 低 电 平 有 效 的 信号 用 星 号 
而 不 是 上 划 线 表示 ,例如 ，W* 表示 非 写 。 
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b) 外 设 时 序 图 
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c) CPU 与 外 设 接口 电路 
图 P2.29 


注意 : 

AS 为 地 址 选 通信 号 ( 当 来 自 CPU 的 地 址 有 效 时 变 为 低 电 平 ) 
DS 为 数据 选 通信 号 ( 当 来 自 CPU 的 数据 有 效 时 变 为 低 电 平 ) 
R/WW 为 读 / 非 写 信号 ( 读 周期 为 高 电 平 ， 写 周期 为 低 电 平 ) 
CS 为 片 选 信号 ( 当 外 设 处 于 读 或 写 周期 时 为 低 电 平 ) 

WE 为 写 使 能 信号 ( 当 外 设 处 于 写 周期 时 为 低 电 平 ) 


im es sy ee ee ee OE an ee re | 
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表 P2.29 
a) 处 理 器 时 序 
参数 最 大 值 /ns 
s Pa Ee EERE. an 
h | MEMES Re Cie ie Me aE i 
i 
h hie EM 10 
t | hI RW i [1 
i |_ 地 址 选 通 为 高 电 平 至 R/W* 为 高 昱 | 0 | 
t 
4 | 数据 保持 H 间 | | 
b) 外 设 时 序 
A. We Be eI Ps. BH d 
fi eee ees eee ee 
Smee Gee meer ls 
eee 


WE* 为 高 电 平 至 CS* 为 高 电 平 
数据 建立 时 间 至 WE* 为 低 电 平 
数据 保持 时 间 至 WE* 为 高 电 平 
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Computer Organization and Architecture: Themes and Variations 
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“整体 的 效果 大 于 各 部 分 的 总 和 。” 


—Anon 


“我 们 像 建 设 城市 一 样 制造 计算 机 系统 : HN, RAM Fo Hk RE” 





Ellen Ullman 


“我 现在 就 能 看 到 未 来 ， 那 时 将 没有 可 移动 部 件 。” 





Bartoz Kijanka 


“磁带 将 比 我 们 所 有 人 活 得 长 。” 
一 一 某 HP 白皮书 的 题目 


“不 要 把 CD 放 进 洗衣 机 一 但 是 如 果 要 坚持 这 样 做 ; 请 使 用 为 精致 面料 设置 的 机 洗 
程序 。” 
—Steve Meretzky 


处 理 器 技术 的 快速 发 展 使 得 计算 机 具有 实时 处 理 视频 数据 的 能 力 ， 半 导体 技术 的 进步 
为 现代 CPU 处 理 数据 提供 了 大 容量 的 直接 访问 存储 器 。 本 章 将 介绍 存储 层次 中 的 下 一 个 层 
次 一 一 二 级 存储 单元 ( secondary storage unit)， 它 用 来 保存 当前 没有 被 处 理 的 大 量 数据 。 这 
些 存储 设备 包括 硬盘 、 固 态 硬盘 以 及 CD/DVD 蓝光 光盘 等 。 

当 硬 盘 在 PC 中 首次 出 现时 ， 其 容量 仅 为 5MB。 今天 ， 处 理 器 就 可 能 具有 8MB 的 
Cache，3 个 TB 的 硬盘 已 经 成 为 商业 化 产品 ，2011 年 Samsung 成 为 首 家 展示 容量 为 4TB 
硬盘 的 公司 。Toshiba 公司 宣布 ， 计 划 在 2013 年 以 面 密度 1Tb/in 实现 STB 的 硬盘 。20 年 间 ， 
硬盘 的 容量 已 增长 了 80 万 倍 。 另 一 方面 ， 硬 盘 访 问 时 间 的 变化 没有 跟 上 其 容量 增长 的 速度 。 
今天 的 硬盘 访问 时 间 仅 比 10 年 前 稍 快 一 点 ， 而 对 固态 硬盘 的 研发 使 新 一 代 高 速 磁盘 的 出 现 
成 为 可 能 。 

由 于 二 级 存储 器 对 计算 机 的 发 展 至 关 重要 ， 本 书 使 用 一 章 来 介绍 其 技术 和 特点 。 首 先 讨 
论 磁 记 录 过 程 的 性 质 并 说 明光 盘 驱 动 器 操作 过 程 。 特 别 是 将 展示 其 机 电 特 性 如 何 决 定 其 性 
能 。 通 过 引入 固态 盘 (solid state disk, SSD)， 当 前 的 半导体 技术 已 经 渗透 大 容量 存储 器 市 场 ， 
故 本 章 将 对 其 进行 介绍 。 

本 章 的 第 二 部 分 将 讨论 光学 存储 介质 的 设备 ， 包 括 CD、DVD 以 及 蓝光 光盘 ， 它 们 提供 
了 低 成 本 、 非 易 失 性 、 可 移动 的 二 级 存储 能 力 。 这 些 介质 的 工作 非常 类 似 磁盘 ， 只 是 其 使 用 
的 是 物质 光学 特性 的 变化 而 不 是 磁 特性 的 变化 来 记录 数据 。 


© IMB=2”B，1GB=2”B，1TB=2”B。 如 果 某 小 说 有 10 万 个 单词 ， 假 定 平均 每 个 英文 单词 由 5 个 字母 组 成 ， 那 
么 3TB 的 硬盘 可 以 放下 600 万 (3 x 24/2") 部 小 说 。 
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3.1 磁盘 驱动 器 


1956 年 ，IBM 发 明了 第 一 个 硬盘 驱动 器 并 作为 305 RAMAC 系统 的 一 部 分 。 它 的 盘 片 
直径 为 24 英寸 ， 容 量 为 5MB， 体 积 比 一 台 洗 衣 机 还 大 ， 成 本 为 几 千 美元 。 到 了 1983 F, 
Seagate 发 明了 第 一 款 PC 用 磁盘 驱动 器 ， 它 能 够 存储 SMB 的 数据 而 成 本 仅 为 1500 美元 ， 
并 可 以 放 进 PC 的 内 部 。 今 天 ， 硬 盘 的 容量 已 达 4TB ， 成 本 不 足 50 美元 。 

磁盘 驱动 器 使 用 的 技术 人 们 早 在 20 世纪 40 年 代 就 已 经 了 解 。 事 实 上 ,磁盘 是 1877 年 
爱迪生 所 发 明 留 声 机 的 直接 衍生 物 。 爱 迪生 将 声音 保存 在 圆 简 上 由 锡 箔 (后 来 为 蜡 ) 覆盖 的 
轨道 上 。 爱 迪生 留声机 根据 声音 震动 在 物理 上 改变 止 桶 的 形状 从 而 实现 声音 的 存储 ， 而 磁盘 
通过 对 轨道 表面 进行 磁化 来 存储 数据 。CD/DVD/ 蓝光 光盘 通过 改变 轨道 表面 的 光学 性 质 来 
存储 数据 。 

磁盘 驱动 器 具有 旋转 的 盘 片 ， 表 面 覆盖 着 一 层 非 常 薄 的 材料 ， 它 可 以 被 磁化 为 两 个 方向 
之 一 : 北 指向 南 或 者 南 指 向 北 。 旋 转盘 片 位 于 写 磁 头 下 方 ， 磁 头 使 盘 片 表面 被 磁化 形成 一 条 
由 1 和 0 组 成 的 圆 形 轨道 。 当 需要 检索 数据 时 ， 读 磁头 (通常 与 写 磁头 共存 ) 检测 表面 的 磁 
通 ， 并 据 此 重建 所 记录 的 数据 。 原 理 似 乎 非常 简单 。 

实际 上 ， 由 于 磁 记 录 区 域 非常 小 且 磁 盘 高 速 旋转 ， 真 正 磁盘 驱动 器 的 结构 和 操作 是 非常 
复杂 的 。 现 代 磁 盘 驱 动 器 的 细节 真是 可 怕 : 磁 层 的 厚度 仅 为 2000 个 原子 ， 读 写 磁 头 在 距离 
磁盘 表面 0.2hm 处 高 度 旋转 。 在 磁 层 的 顶部 是 一 层 碳 氟 化 合 物 组 成 的 润滑 层 ， 只 有 约 一 个 分 
子 的 厚度 。 : 

在 介绍 磁盘 驱动 器 的 结构 和 特点 之 前 ， 本 章 首先 讨论 磁 记 录 的 原理 ;: 包括 近年 来 促使 磁 
盘 容 量 从 10GB 发 展 到 4TB 的 磁盘 驱动 器 设计 技术 , 这 是 二 个 里 程 碑 sj 来自 IBM 的 图 3-1 
给 出 了 了 儿 种 磁盘 驱动 器 的 面 密度 (areal density) 及 对 应 年 份 , :并 绘 出 了 从 1956—2001 年 这 
45 年 中 磁盘 记录 密度 显著 增加 的 情况 。 面 密度 指出 了 磁盘 的 位 记录 密度 , “通常 以 每 平方 英 
寸 记 录 的 位 数 来 衡量 。 面 密度 从 约 2 x 10°Mb/in? 发 展 到 4 x 104Mb/in*， 在 约 50 年 的 时 间 内 
增加 了 7 个 数量 级 。 到 -2010 年 ，Toshiba 发 布 了 面 密度 为 540Gb/in”( 即 54 x 10*Mb/in’ ) 的 
硬盘 ,一 年 后 Toshiba 发 布 了 一 款 在 笔记 本 中 使 用 的 硬盘 ， 其 面 密度 为 744Gb/in”。 


第 一 款 反 铁 磁 耦合 (AFC) 介质 磁盘 ”9g” 











第 一 款 磁 阻 (MR) 磁头 磁盘 
第 一 款 薄 膜 磁头 磁盘 


面 密度 (Mb/in? ) 
> 


IBM RAMAC (第 一 款 硬盘 ) 





Courtesy of Ed Grochowski. 


1960 1980 2000 “2010 
年 份 


图 3-1 .1960 年 以 来 的 记录 密度 


磁盘 容量 随 着 微软 操作 系统 的 发 展 而 不 断 提升 。 图 3-2 给 出 了 磁盘 容量 和 操作 系统 的 发 
展 情况 。 没 有 大 容量 磁盘 ,不 可 能 出 现今 天 的 操作 系统 。 当 然 , 也 有 些 人 认为 ， 今 天 的 许多 
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软件 都 是 腾 肿 的 ， 应 该 使 用 较 小 的 磁盘 空间 。 


10,000,000 


1,000,000 


容量 ( 字 节 ) 





1980 1985 





1990 1995 2000 
年 份 


图 3-2 操作 系统 、 磁 盘 容 量 随时 间 的 关系 


© Cengage Learning 2014 


3.2 ”磁性 和 数据 存储 


磁 存 储 技术 相当 有 起， 它 属于 计算 机 技术 的 早期 技术 ,依赖 具有 运动 部 件 的 机 电 装 置 一 
起 工作 。 磁 记录 技术 已 经 被 使 用 了 很 长 一 段 时 间 。 例 如 ， 钢 丝 录音 机 可 以 在 一 卷 钢 丝 上 录制 
声音 ， 直 到 二 战 后 才 被 磁带 录音 机 取代 。 然 而 尽管 存在 固有 的 局 限 性 ， 磁 存储 技术 始终 没有 
消失 。 事 实 上 ，2000 年 12 月 《 IEEE Spectrum 》 中 的 一 篇 文章 的 题目 就 是 “ 磁 存 储 器 : 不 
会 消亡 的 介质 ”。9 

材料 的 磁性 可 能 是 最 明显 的 数据 存储 方式 ， 因 为 磁性 是 很 好 的 二 进 制 记录 介质 : 磁性 粒 
子 可 以 磁化 为 N-S 或 者 S-N 方 向 。 当 某 材 料 被 磁化 后 ， 它 将 保持 磁化 状态 直到 按照 相反 的 
方向 被 磁化 ， 这 使 得 磁 存 储 机 制 本 身 具 有 非 易 失 性 。 

本 节 将 在 原子 层面 介绍 磁化 的 概念 ， 展 示 如 何 将 材料 磁化 为 两 种 状态 。 然 后 说 明 如 何 使 
用 材料 的 这 种 属性 构造 磁盘 驱动 器 。 

磁性 源 于 材料 的 原子 结构 ， 特 别 是 电子 在 原子 中 的 行为 。 电 子 有 两 种 动作 : 绕 原子 核 旋 
转 与 自 旋 〈spin)。 电 子 的 自 旋 是 形成 磁性 的 原因 。 虽然 自 旋 这 个 词 意味 着 旋转 ， 如 果 读 者 认 
为 电子 像 陀 螺 一 样 旋转 这 就 是 误导 。 电 子 有 两 个 量子 自 旋 值 ， 称 为 自 旋 向 上 (spin up) 和 自 
旋 向 下 (spin down), 

在 铁 磁 (ferromagnetic) 材料 中 ， 单 个 原子 的 自 旋 是 匹配 的 ; 也 就 是 说 ， 相 邻 原子 之 间 
是 相互 作用 的 。 当 施加 外 部 磁场 时 ， 铁 磁 原 子 将 沿 着 磁场 方向 排列 。 当 去 除外 部 磁场 后 ， 铁 
电 材 料 可 以 保留 一 些 原先 磁场 方向 的 磁性 。 

铁 磁 材料 中 电子 间 的 量子 相互 作用 的 范围 超出 了 单个 原子 。 这 种 相互 作用 导致 称 为 域 
(domain) 的 某 个 范围 内 的 原子 磁 抢 并 行 排列 。 域 的 大 小 为 30nm ~ 150hm。 

铁 磁 材料 中 ,， 域 的 排列 是 随机 的 ， 如 图 3-3a 所 示 ， 整 体 上 没有 磁性 。 图 3-3b 给 出 了 施 


© R. Comerford. “Magnetic Storage: The medium that wouldn’t die.” IEEE Specturm, December 2000, pp. 36-39. 
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加 外 部 磁场 后 的 影响 。 与 外 部 磁场 方向 相同 的 域 保持 其 磁化 方向 ， 而 与 外 部 磁场 方向 不 同 的 
域 将 根据 外 部 磁场 旋转 而 改变 其 方向 。 

由 于 材料 内 部 磁场 是 外 部 磁场 和 所 有 域 对 应 磁场 的 琶 加 ， 当 越 来 越 多 的 域 改 变 为 与 外 部 
磁场 相同 的 方向 ， 内 部 磁场 的 磁性 将 迅速 增加 。 突 然 ， 内 部 磁场 像 雪 前 一 样 建立 起 来 ， 与 外 
部 磁场 方向 相同 的 域 急剧 增加 。 很 快 ， 所 有 域 都 磁化 为 相同 的 方向 ， 如 图 3-3c 所 示 ， 此 时 
材料 称 为 被 磁化 (magnetize)。 如 果 去 除外 部 磁场 ， 材 料 仍 保持 磁化 状态 ， 这 是 因为 由 域 组 
成 的 磁场 足够 强大 可 阻止 域 的 重新 排列 。 


域 的 磁化 方向 是 
全 随机 的 。 材 料 整体 
Baa Sa 不 表现 磁性 


a) 无 外 部 磁场 





某 些 域 的 磁化 方 
D 向 旋转 





b) 施加 弱 外 部 磁场 


所 有 域 的 磁化 
Ss 方向 相同 。 材 料 
LD ED Gp en 被 磁化 


c) 施加 强 外 部 磁场 
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图 3-3 ”磁化 和 域 


提高 材料 的 温度 增加 了 原子 的 热 运 动 。 在 磁 材 料 中 ,不 断 加剧 的 热 运 动 最 终 将 克服 域 的 
凝聚 力 从 而 使 材料 消 磁 ; 域 的 方向 再 次 变 为 随机 。 发 生 此 种 变化 的 温度 称 为 居 里 点 (Curie 
point)， 铁 的 居 里 点 超过 1000C, 

铁 磁 材料 的 内 部 磁场 相对 外 部 磁场 的 变化 可 
绘 出 如 图 3-4 所 示 的 曲线 ， 该 曲线 被 称 为 磁 滞 曲线 
(hysteresis curve). 

横 轴 五 代表 了 外 部 磁场 。 没有 外 部 磁场 时 :( 即 
H=0), At BMA +B, RÉ -Bno BEA RE 
化 为 两 个 状态 之 一 。 假 设 A=0 时 材料 的 初始 状态 为 
B=+B., 卫 沿 着 正 向 增加 。 曲 线 将 会 到 达 R 点 。 去 除 
外 部 磁场 后 ， 材 料 将 回 到 +B 状态 。 

假设 材料 处 于 +B, 状态 且 外 部 磁场 吾 朝 着 5 点 沿 负 向 增加 。 当 去 除外 部 磁场 后 ， 材 料 将 
回 到 +B, 状态。 如果 外 部 磁场 负 向 增 大 超过 5 点 后 ， 域 开始 转换 方向 ， 材 料 将 迅速 改变 其 磁 
化 方向 ， 曲 线 将 到 达 P 点 。 此 时 再 去 除外 部 磁场 后 ， 材 料 将 稳定 在 -B 状态 ， 只 是 方向 与 原 
来 相反 。 

图 3-4 表明 ， 位 于 状态 +B, 的 材料 可 以 通过 施加 小 于 -到 ,( 绝 对 值 大 于 Hn) 的 外 部 磁场 
而 变 为 状态 -8,。 同 样 ， 位 于 状态 -B, 的 材料 可 以 通过 施加 大 于 +, 的 外 部 磁场 而 变 为 状态 
FR 


可 以 通过 施加 足够 强 的 正 向 或 负 向 磁场 使 材料 磁化 。 下 面 将 解释 如 何在 实践 中 实现 这 种 
操作 以 及 如 何 检测 磁性 材料 的 状态 。 
磁性 材料 的 男 一 个 特性 是 它 的 矫 顽 力 ( coercivity)， 即 将 残余 磁 通 量 减 小 到 零 所 必须 施 
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加 的 磁场 强度 。 磁 性 材料 通常 分 可 以 为 两 类 : 硬 (hard) 磁 材 料 和 软 〈soft) 磁 材 料 。 硬 磁 材 
料 具 有 高 矫 项 力 ， 可 以 被 永久 磁化 ; 而 软 磁 材 料 具 有 低 矫 闫 力 ， 当 去 除外 部 磁场 时 不 表现 出 
磁性 。 磁 盘 中 的 读 写 头 是 由 软 磁 材 料 构成 ,而 存储 数据 的 磁性 涂 层 由 硬 磁 材料 构成 。 


3.2.1 -E | BX 


Al 3-5 给 出 了 在 磁 记 录 介 质 (如 硬盘 、 软 盘 和 磁带 ) 土 读 
写 数据 所 使 用 的 读 / 写 头 的 结构 。 早 期 的 记录 磁头 由 环形 软 
磁铁 磁体 绕 着 几 圈 线圈 构成 。 

高 频 磁 场 在 写 头 中 产生 的 涡流 (eddy current) 降低 了 其 
工作 效率 。 第 二 代 头 使 用 不 导电 的 铁 氧 体 《ferrite) 铁 磁 材料 
(由 铁 和 镍 或 铁 和 和 锌 组 成 的 陶瓷 复合 材料 ) 。 

由 于 记录 系统 复杂 的 访问 需求 ， 构 建 读 / 写 头 十 分 困难 。 
磁头 间隙 必须 尽 可 能 小 ， 因 为 它 决定 子 从 写 头 泄漏 到 磁 记 录 介 质 的 磁场 大 小 。 如 果 间 院 很 
K, 磁化 的 面积 也 大 ， 可 以 存储 在 磁盘 上 最 大 的 位 数 就 会 减少 。 

人 磁头 必须 使 用 具有 极 高 饱和 度 《 即 材料 中 可 以 产生 的 最 大 磁场 ) 的 铁 磁 材 料 构 成 ， 这 
是 因为 磁化 记录 介质 需要 强 磁场 。 磁 头 材 料 同 时 还 必须 具有 较 小 的 剩 磁 ( 即 写 电流 消失 
后 的 剩余 磁场 )。 如 果 剩 磁 太 高 ， 以 前 的 磁化 位 可 能 受到 剩 磁 的 干扰 。 如 果 使 用 同一 个 磁 
头 来 完成 读 写 ， 它 必须 具有 高 渗透 率 (permeability)， 人 们 利用 材料 的 渗透 率 来 衡量 材料 
对 磁 通 的 导 通 能 力 : 渗透 率 越 高 ， 就 越 容易 磁化 材料 。 读 头 也 应 该 具有 低 饱 和 磁 致 伸缩 
(magnetostriction) 。 磁 致 伸缩 用 来 描述 磁场 变化 改变 材料 尺寸 的 现象 。 如 果 读 头 遭 受 任何 形 
式 的 物理 冲击 ， 磁 致 伸缩 将 产生 寄生 磁场 ， 导 致 线圈 中 出 现 杂 散 电流 。 所 有 这 些 磁 性 特性 
中 ， 磁 头 必须 物理 上 健壮 、 耐 磨损 和 耐 腐蚀 。 

记录 过 程 

下 面 将 介绍 在 磁性 材料 中 记录 数据 的 过 程 。 图 3-6 给 出 了 记录 过 程 的 示意 图 。 线 圈 绕 在 
金属 环 上 。 当 有 电流 通过 线圈 时 ， 线 圈 中 就 会 产生 磁场 ， 这 进一步 导致 了 在 金属 环 中 产生 磁 
场 。 金 属 环 于 端 具 有 一 个 微小 的 间隙 ， 磁 场 会 通过 该 间隙。 实际 上 ， 泄 露 的 磁场 改变 了 周转 
的 环境 。 如 果 间 院 接 近 铁 磁 材 料 ， 泄 漏 的 磁场 将 使 其 磁化 。 硬 盘 与 磁带 (或 卡带 ) 记录 装置 
的 区 别 在 于 硬盘 驱动 器 中 磁头 位 于 旋转 的 盘 片上 方 ， 而 磁带 驱动 器 中 磁头 位 于 涂 有 磁性 材料 
的 磁带 上 方 。 
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图 3-5 读 写 磁头 的 基本 结构 


读 / 写 头 









磁头 间隙 中 泄漏 的 磁 通 
图 3-6 ”记录 过 程 
图 3-7: 展 示 了 改变 写 磁 头 线圈 中 的 电流 所 产生 的 影响 ;以 及 通过 写 头 下 方 的 材料 表面 的 
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3.2.2，” 磁 记录 密度 的 极限 


磁 记 录 机 制 下 磁 记 录 面 密度 存在 物理 极限 ; 也 就 是 说 ， 每 平方 英寸 可 存储 的 最 大 比特 数 
是 有 限 的 。 幸 运 的 是 ， 当 达到 预期 (anticipated) 的 理论 限制 后 ， 物 理学 家 和 工程 师 似乎 又 
找到 扩展 理论 最 大 值 的 方法 (类似 摩 尔 定律 的 情况 )。 

20 世纪 90 年 代 ， 科 学 家 们 认为 ， 一 种 称 为 超 顺 磁 (superparamagnetic) 的 效应 限制 了 
磁 记 录 密 度 。 可 以 用 来 存储 信息 的 最 小 磁性 材料 被 称 为 磁 栖 粒 ( grain, 一 种 单 磁 畴 粒子 )， 
通过 其 构成 了 如 磁盘 表面 的 磁性 材料 。 当 颗粒 达到 10nm 左右 的 量 级 时 ， 热 效应 会 导致 这 些 
颗粒 在 室温 下 自动 消 磁 s 这 导致 最 大 面 密度 约 为 6Gb/cm? 或 0.93Gb/in* 。 幸 运 的 是 ， 人 们 已 
经 发 现 了 几 种 避免 超 顺 磁 效 应 的 方法 。 

图 3-8 展示 了 在 记录 介质 表面 水 平 磁化 的 效果 a 该 图 表示 以 最 小 区 域 进行 记录 的 最 坏 情 
Ui, 交替 记录 了 N-S 和 S-N。 男 一 种 记录 方式 是 垂直 磁化 ， 如 图 3-9 所 示 ， 其 中 磁 域 的 磁化 
方向 与 记录 介质 表面 形成 直角 s 垂直 记录 方式 减少 了 相 邻 比特 位 之 间 互 相 消 磁 的 影响 ， 因 为 
某 域 的 朝向 并 没有 与 男 一 个 域 的 朝向 针锋相对 s。 这些 域 组 成 了 封闭 磁场 的 一 部 分 。 
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图 3-8 ”传统 的 水 平 磁化 


图 3-9 垂直 磁化 


垂直 记录 需要 特殊 的 写 头 设计 ( 即 与 传统 的 水 平 磁化 记录 磁头 不 同 )。 需要 使 用 “ 单 极 
型 磁头 ”在 介质 二 进行 垂直 磁 转 换 写 操作 。 
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磁 微 粒 的 微小 距离 会 使 相 邻 粒子 彼此 消 磁 。 图 3-10 显示 了 一 种 由 Fujitsu 提出 的 减少 垂 
直 粒 子 的 大 小 而 不 会 消 磁 的 方法 。 该 技术 可 以 将 传统 技术 的 面 密度 增加 8 倍 ， 达 到 50Gb/ 
cm*。 到 2000 年 左右 ， 发 布 的 磁 介 质 面 密度 接近 700Gb/cm’ ( 100Gb/in  )。 到 2011 年 ， 面 
密度 超过 700Gb/in? 的 磁盘 已 经 开始 销售 。 
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3-10 具有 磁性 背面 (magnetic backing) 的 垂直 磁化 


延缓 不 可 避免 的 超 顺 磁 效应 产生 影响 的 一 种 方法 是 ， 通 过 增加 反 转 磁 颗 粒状 态 所 需 的 能 
量 屏障 来 改进 介质 的 磁 特 性 。 图 3-10 中 的 方法 是 在 磁 记 录 表 面 下 设置 一 层 磁 性 软 介质 。 

传统 的 磁 面 是 均一 的 ; 也 就 是 说 ， 它 们 是 由 单一 金属 薄膜 或 由 磁性 颗粒 黏 和 在 一 起 的 涂 
层 构成 。 硬 盘 设 计 师 不 断 探讨 使 用 晶 格 介质 〈Ppatterned media) 来 存储 数据 。 每 一 位 唱 格 由 
被 非 磁性 介质 包围 着 的 磁性 材料 组 成 ， 这 样 可 以 降低 相 邻 区 域 间 的 消 磁 效 应 。 


3.2.3 ”磁盘 数据 记录 原理 


下 面 将 介绍 数据 是 如 何 存储 在 磁盘 中 的 ， 以 及 记录 过 程 和 回放 过 程 是 如 何 工作 的 。 图 
3-11 显示 了 数据 在 磁盘 表面 上 是 如 何 组 织 的 。 读 / 写 头 可 以 向 中 心 或 者 外 围 移动 或 步 进 
(step)。 当 磁盘 旋转 时 ， 磁 头 下 的 轨迹 形成 磁道 (track)。 对 于 单位 数据 来 说 磁道 容量 太 大 ， 
故 磁 道 通常 被 分 为 不 同 的 扇 区 (sector)。 一 个 扇 区 是 从 磁盘 读 写 数据 的 最 小 单位 。 磁 盘 上 数 
据 的 组 织 结构 对 磁盘 驱动 器 的 性 能 有 重要 的 影响 。 以 数据 的 粒度 〈granularity) 为 例 来 说 明 : 
如 果 使 用 小 扇 区 ， 由 于 大 文件 会 占用 许多 扇 区 ， 每 个 扁 区 都 有 开销 ， 因 此 这 种 方案 的 效率 不 
高 ; 另 一 方面 ， 如 果 使 用 大 扇 区 ， 当 用 户 需 要 存储 小 规模 数据 时 ， 该 方案 的 效率 也 不 高 。 例 
如 ， 如 果 扇 区 大 小 为 8SKB， 用 户 具 有 许多 3KB 大 小 的 文件 ， 每 个 扇 区 就 会 浪费 SKB 的 空 
间 。 典 型 的 磁盘 证 区 的 大 小 为 512 字 节 。 

为 了 减少 磁盘 驱动 器 的 物理 尺寸 、 增 加 其 数据 容量 ， 磁 盘 制 造 商 在 同一 个 转轴 上 安装 几 
个 盘 片 ， 读 取 每 个 盘面 的 读 / 写 磁头 被 连接 到 同一 个 电机 ， 这 样 所 有 磁头 可 以 一 起 移动 。 图 
3-12 给 出 了 具有 3 个 盘 片 的 磁盘 系统 。 早 期 的 磁盘 驱动 器 不 使 用 最 顶层 和 最 底层 的 盘面 存 
储 数据 ， 因 此 图 3-12 中 只 使 用 了 4 个 盘面 。 然 而 ， 现 代 磁 盘 驱 动 器 使 用 所 有 盘面 。 


旋转 ”磁道 HE 
(磁头 沿 着 磁道 读 写 数据 ) (由 所 有 当前 被 访 









问 的 磁道 构成 ) 


hg / 写 头 。 电 宙 使 磁头 移动 ， 
转轴 定位 至 所 选 磁道 
图 3-11 对 材料 表面 的 磁化 图 3-12 多 个 盘 片 的 磁盘 驱动 器 


图 3-12 中 ,电机 使 磁头 在 磁道 之 间 移 动 ， 磁 头 组 件 沿 着 磁道 移动 。 这 种 方式 如 今 没有 
广泛 使 用 是 由 于 其 实现 复杂 、 速 度 慢 。 一 种 更 简单 的 电机 使 用 磁 辟 在 磁盘 表面 上 扫 动 (就 像 
古老 的 黑色 乙烯 留声机 的 唱 臂 )。 图 3-13 给 出 了 一 款 使 用 类 似 磁头 追踪 机 制 的 Seagate 硬盘 
驱动 器 的 照片 。 
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图 3-13 ”磁盘 驱动 器 


BART 

微机 中 标准 的 硬盘 为 3.5 英寸 驱动 器 。 读 者 可 能 认为 其 盘 片 的 尺寸 小 于 3.5 英寸 。 其 
实 不 然 。 其 盘 片 的 直径 为 3.75 英寸 。 同 样 ，3.5 英寸 驱动 器 的 宽度 并 不 是 3.5 英寸 ， 而 是 
4 英寸 。3.5 英寸 这 个 术语 表示 的 是 磁盘 的 形状 因子 (form factor) 而 不 是 其 物理 宽度 。 











磁盘 速度 
磁盘 的 边缘 旋转 到 底 有 多 快 ? 
车 磁盘 的 直径 为 3.75 英寸 ， 则 其 周 长 为 11.78 英寸 。 如果 磁盘 转速 为 7200rpm (每 
分 钟 的 转 束 )， 磁 盘 外 沿 的 过度 为 7069 英尺 /min 或 424 FER /h, HZ 80.3mph (每 
小 时 英里 数 )。 


为 了 在 磁盘 表面 产生 微小 的 磁场 ， 就 必须 具有 微小 的 磁性 粒子 、 微 小 的 磁头 间隙 以 及 在 
磁头 和 记录 介质 表面 间 的 微小 间距 。 由 于 上 述 任意 一 个 参数 在 没有 其 他 参数 配合 的 条 件 下 都 
不 能 得 到 提升 ， 因 此 所 有 技术 的 发 展 都 必须 同步 考虑 上 述 参 数 的 改进 。 

使 用 现代 制造 技术 在 写 磁 头 中 实现 非常 小 的 间隙 变 得 相对 容易 。 实 现 以 50mph 旋转 
的 盘 片 并 使 磁头 保持 在 盘 片上 方 仅 有 10x 10 MARR. 事实 上， 如果 没有 边界 效应 
(boundary effect)， 这 是 不 可 能 实现 的 。 

当 磁 盘 在 空气 中 旋转 时 ， 其 表面 的 气体 也 会 以 磁盘 的 速度 旋转 ， 这 是 由 于 粗糙 的 磁盘 表 
面 拖 动 了 气体 分 子 。 但 在 磁盘 表面 上 方 的 一 定 距 离 之 外 ， 气 体 不 会 移动 。 因 此 ， 在 磁盘 表面 
和 表面 上 部 空间 之 间 产 生 了 速度 差异 。 

读 / 写 头 构成 了 称 为 滑 块 (slider) 的 结构 中 的 一 部 分 ， 该 结构 主要 完成 将 磁头 移动 至 所 
需 磁道 的 功能 。 滑 块 将 磁头 和 电机 通过 悬挂 圳 (suspension arm) 连接 在 一 起 ， 悬 挂 臂 用 于 传 
输 来 自 磁头 的 信号 ， 并 将 磁头 保持 在 所 需 位 置 。 滑 块 具 有 合适 的 气动 特性 ， 它 可 以 “飞行 ” 
在 处 于 边界 效应 的 磁盘 表面 上 方 。 

PLR GX BAMBI) 产生 的 升力 与 其 表面 空气 的 流动 速度 的 平方 成 正比 。 当 滑 块 即将 移 
动 到 磁盘 上 时 ， 空 气流 动 得 更 快 ， 从 而 产生 更 大 的 升力 ， 使 得 滑 块 几乎 保持 在 磁盘 表面 上 方 
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一 个 恒定 的 位 置 。 也 可 以 说 ， 滑 块 通过 空气 轴承 (air bearing) 悬 停 在 磁盘 表面 。 

飞行 头 能 够 以 非常 高 的 精度 跟随 磁盘 表面 的 起 伏 。 滑 块 的 悬 架 必须 提供 一 个 向 磁盘 方向 
的 力 来 对 抗 会 导致 滑 块 飞 离 磁 盘 表 面 的 空气 轴承 的 气动 力 。 力 的 大 小 必须 精确 地 施加 在 恰当 
的 位 置 ， 和 否则 扭转 力 会 使 滑 块 的 一 角 离 磁盘 表面 太 近 ， 而 另 一 角 离 磁盘 表面 的 太 远 。 

设计 有 效 的 空气 轴承 比 人 们 想象 的 要 困难 。 由 于 磁头 在 磁盘 的 内 道 和 外 道 之 间 移 动 ， 磁 
头 与 磁盘 表面 的 相对 速度 大 约 有 2 : 1 的 变化 ， 因 此 与 空气 的 相对 速度 也 在 变化 。 现 代 空 气 
轴承 设计 能 够 弥补 这 一 点 ， 使 磁头 保持 在 磁盘 表面 约 1.0 pin 之 上 的 距离 。 

悬 架 必 须 允 许 滑 块 在 俯仰 和 侧 滚 的 方向 取得 平衡 ( 即 旋转 )， 这 样 尽 管 磁 盘 表面 有 起 伏 
都 可 以 使 其 与 表面 保持 接近 。 

图 3-14 显示 了 从 1993 一 2004 年 之 间 ， 磁盘 表面 与 磁头 间距 的 减少 情况 。 这 种 改善 表 
明 当 代 磁 头 距离 磁盘 表面 的 高 度 大 约 为 10nm( 即 10“m) 数量 级 ， 这 是 一 个 非常 小 的 间隙。 
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图 3-14 磁头 与 磁 面 的 距离 


如 果 磁头 未 能 保持 在 磁盘 表面 上 方 ， 以 约 50 英里 /hb 的 速度 撞击 磁盘 ， 将 导致 磁性 涂 层 
的 损害 并 破坏 数据 。 该 情况 被 称 为 磁头 碰撞 (head crash)， 这 个 词 现在 用 于 指示 所 有 突 发 、 
灾难 性 的 计算 机 系统 故障 。 图 3-15 给 出 了 经 典 的 比较 ， 它 表明 从 读 / 写 头 到 磁盘 表面 的 间 
距 是 多 么 小 。 按 照相 同比 例 ， 可 以 对 比 该 间距 与 人 类 头发 、 烟 和 雾 颗 粒 和 指纹 的 大 小 。 是 的 ， 
磁头 的 飞行 高 度 比 指纹 的 高 度 还 小 。 


读 / 写 磁头 


非 磁性 基 片 
图 3-15 ”磁头 与 磁 面 间距 相对 大 小 
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如 果 设 计 桌 面 计算 机 硬盘 中 具有 微小 的 飞行 高 度 和 轨道 间距 的 磁头 悬 架 机 制 是 一 件 困难 
亚 作 的 话 ， 想 想 那些 为 笔记 本 电脑 和 其 他 便携 电脑 设计 悬 架 、 滑 块 以 及 磁头 机 制 的 工作 。 磁 
头 必须 在 因 计 算 机 移动 产生 震动 和 加 速 运动 的 情况 下 保持 其 飞行 高 度 。 
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磁盘 驱动 器 不 工作 时 磁头 的 状况 又 如 何 呢 ? 早期 的 磁盘 驱动 器 在 启 停 阶段 使 用 着 陆 区 
(landing zone) 来 放置 磁头 。 当 然 ， 该 区 域 并 不 用 来 存储 数据 。 磁 头 和 磁盘 表面 技术 的 改进 
导致 了 非常 光滑 的 磁头 和 光滑 的 磁盘 表面 。 非 常 非常 光滑 ， 以 至 于 当 磁盘 停止 旋转 时 ， 磁 头 
和 磁盘 表面 可 以 粘 在 二 起 (这 是 冷 焊 (cold welding) 的 一 种 形式 ， 发 生 在 两 个 原子 级 光滑 表 
面 接触 时 )。 

今天 ， 磁 头 制 动 并 将 其 从 磁盘 表面 移 开 ， 如 图 3-16 所 示 。 当 关闭 电机 的 电源 ， 它 在 减 

O 速 时 产生 反 电 动 势 (back EMF)。 使 用 该 电压 可 以 将 滑 块 移动 至 某 个 斜面 并 脱离 磁盘 的 表面 。 


| 制 动 位 置 PEAR THEY 
| 架 /电机 的 位 置 É 


M 

I 下 电 时 ， 转 轴 电 机 产生 的 
反 电动 势 在 磁盘 停止 旋转 之 
前 使 滑 块 退出 工作 区 


图 3-16 磁头 工作 机 制 


磁盘 可 以 存储 的 数据 量 是 每 英寸 磁道 的 数量 以 及 磁道 中 每 英寸 记录 的 数据 位 的 函数 。 这 
两 个 参数 的 乘积 就 是 面 密度 〈areal density)， 用 每 平方 英寸 记录 的 位 数 表 示 。 只 能 通过 提高 
磁道 中 每 英寸 记录 的 数据 位 或 每 英寸 磁道 的 数量 来 提高 面 密度 。 当 每 英寸 记录 的 位 数 增加 
时 ， 每 位 所 占 的 空间 相应 减 小 。 如 果 每 位 变 得 更 小 ， 磁 盘旋 转 导 致 磁头 读 出 的 信号 降低 ， 这 
使 得 对 数据 进行 可 靠 的 解码 变 得 更 困难 。 





Courtesy of Ed Grochowski. 
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硬盘 ， 其 中 的 热 校 正 过 程 被 有 效 地 隐藏 。 
今天 的 磁盘 引入 了 反馈 来 实现 更 精确 的 磁头 定位 机 制 ， 因 此 没有 必要 再 进行 起 校正 了 。 


使 用 读 / 写 头 来 最 大 化 面 密 度 的 一 种 方法 是 减少 磁头 到 磁盘 的 距离 
高 度 (fly height)。 降 低 飞行 高 度 使 得 每 位 的 输出 信号 更 强 、 更 容易 被 检测 。 

不 幸 的 是 ， 有 几 个 因素 会 对 飞行 高 度 产生 不 利 影响 ; 例如 纬度 或 温度 的 变化 、 污 染 物 的 
影响 、 外 部 冲击 和 振动 等 。 磁 盘 环境 参数 的 优化 可 以 在 读 取 数 据 时 降低 驱动 器 的 错误 几率 。 
同样 ， 如 果 写 磁头 距离 磁盘 表面 太 高 ， 磁 场 可 能 不 足以 可 靠 地 完成 对 介质 的 写 操作 。 这 将 导 
致 可 以 被 纠正 的 软 错误 。 

Westen Digital 公司 引入 了 一 种 称 为 飞行 高 度 监 控 (Fly Height Monitoring) 的 机 制 对 潜 
在 的 失效 进行 检测 并 发 出 警告 。 该 机 制 使 用 写 状态 检测 器 在 检测 到 传感器 的 高 度 偏离 其 正常 
位 置 时 就 暂停 所 有 写 操 作 。 

当 原始 数据 以 模拟 信和 号 的 形式 从 磁盘 表面 读 取 时 ， 磁 通 量 的 改变 导致 读 磁头 中 产生 脉 
冲 。 用 来 定义 脉冲 的 一 个 参数 为 波形 ( shape); 即 其 面积 和 峰值 之 间 的 比率 。 脉 冲 的 波形 可 
以 用 来 监测 磁头 的 高 度 。 当 磁头 位 置 升 高 ， 脉 冲 高 度 与 宽度 之 间 的 比例 增加 ， 这 为 每 个 磁头 
提供 了 一 种 可 测量 和 可 重复 出 现 的 关系 。 由 于 各 个 驱动 器 的 参数 不 同 ， 在 磁盘 制造 过 程 中 需 
要 对 磁头 高 度 检测 电路 进行 校准 。 

如 果 监 控 器 检测 到 不 安全 的 条 件 ， 就 中 止 写 过 程 。 然 后 再 重新 该 写 操作 。 如 果 写 操作 仍 
不 成 功 ， 可 能 会 重新 分 配 数据 写 到 磁盘 中 的 其 他 区 域 。 

1. 盘 片 技术 

今天 的 盘 片 比 其 祖先 更 加 复杂 ， 早 期 的 盘 片 大 都 是 铝 盘 片 表面 黏 和 磁性 材料 〈 铁 氧化 
物 ) 构成 的 涂 层 。 影 响 磁 盘 数 据 密 度 的 两 个 关键 参数 是 读 / 写 磁 头 的 飞行 高 度 和 磁性 粒子 的 
大 小 。 

某 些 磁盘 是 由 低 杂 质 的 玻璃 制 成 ， 这 是 由 于 玻璃 比 铝 更 耐 热 ( 其 膨胀 系数 更 小 )、 更 光 
滑 、 更 坚硬 。 图 3-17 是 来 自 IBM 的 显 微 照片 ， 比 较 了 铝 和 玻璃 表面 的 光滑 度 。 相 同 重量 
下 ， 玻 璃 比 铝 更 坚硬 。 较 好 的 刚度 将 在 高 速 运动 时 降低 噪声 和 振动 。 玻 璃 的 刚度 使 得 盘 片 可 
以 做 得 更 薄 更 轻 ， 这 可 以 减少 主轴 电机 的 负载 。 此 外 ， 更 轻 的 盘 片 意味 着 更 短 的 加 速 时 间 。 





减少 磁头 的 飞行 


Composed from two original images © IBM Corporation. 





Images used with permission. 


Al3-17 盘 片 表面 的 光滑 度 


REFS Ze EMR (sputtering) 了 多 个 涂 层 。 溅 射 过 程 是 将 磁盘 放 在 高 真空 中 ,然后 通过 
蒸发 涂 层 在 磁盘 表面 创建 一 层 薄 膜 。 
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现代 磁盘 片 包含 5 层 或 更 多 的 层 (如 图 3-18 所 示 )。 最 上 层 为 润滑 层 ， 提 高 磁头 与 磁盘 
接触 的 耐久 性 。 润 滑 层 下 面 是 一 层 薄 的 碳 基 保护 层 。 润 滑 层 厚 约 Inm, 保护 层 厚 约 15nm。 
记录 表面 由 两 层 组 成 : 记录 层 (通常 是 钴 和 铬 的 化 合 物 ) 和 铬 底层 。 最 后 ， 玻 璃 基 片 为 上 述 
4 层 提供 衬 底 。 


盘 片 的 
横 切 面 
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图 3-18 ” 盘 片 的 横 切 面 


2. 巨 阻 磁头 一 一 读 写 技术 的 巨大 进步 

传统 的 读 磁头 存在 一 个 重要 的 限制 一 一 电感 ( induction)。 为 了 检测 磁 通 的 变化 ， 磁 头 
上 需要 缠绕 许多 臣 线 圈 以 获得 足够 强度 的 信号 。 增 加 线圈 臣 数 将 增加 线圈 的 电感 。 电 感 是 一 
种 电路 的 属性 ， 它 会 抵抗 并 降低 电流 的 变化 率 。 增 加 读 磁头 的 电感 会 降低 从 磁盘 表面 读 出 的 
磁 通 的 变化 率 。 幸 运 的 是 ， 人 们 发 现 了 材料 的 一 种 磁 特 性 ( 稍 后 介绍 )， 可 以 极 大 降低 电感 
对 读 磁 头 的 影响 。 此 外 ， 取 消 了 感应 式 读 磁头 意味 着 写 磁 头 可 以 为 写 操作 进行 优化 。 

磁场 会 引起 某 些 材料 的 电阻 发 生 微 水 变化 ， 该 特性 称 为 磁 阻 (magnetoresistive，MR ) 
效应 。 使 用 磁 阻 效应 来 检测 磁盘 磁 通 量 的 变化 优 于 传统 的 感应 式 读 磁头 ， 这 是 由 于 磁 阻 磁头 
具有 更 小 的 电感 ， 可 以 更 快 地 读 取 数据 。 

IBM 在 1991 年 的 1GB 磁盘 驱动 器 中 率先 使 用 磁 阻 磁头 ， 到 1994 Æ, IBM 的 实践 已 经 
表明 达到 3Gb/in 的 面 密度 是 可 能 的 。 不 幸 的 是 ， 磁 阻 磁头 输出 的 电信 和 号 非常 低 。20 世纪 
80 年 代 后 期 ， 研 究 人 员 发 现 某 些 材 料 在 磁场 中 的 电阻 会 发 生 将 近 50% 的 巨大 改变 。 这 种 属 
性 被 称 为 巨 磁 阻 (giant magnetoresistive, GMR) 效应 ， 它 存在 于 由 很 薄 的 金属 元 素 层 交替 
组 成 的 材料 中 。 人 们 很 快 就 意识 到 ， 巨 磁 阻 效应 可 以 用 来 建立 高 效 的 读 磁 头 ，IBM 是 第 一 个 
尝试 利用 巨 磁 阻 效应 的 商业 组 织 。 

巨 磁 阻 磁头 的 优点 是 它们 对 磁盘 的 磁场 变化 更 加 敏感 ， 可 以 检测 尺寸 更 小 的 记录 位 。 同 
样 ， 数 据 可 以 以 更 高 的 速度 读 取 且 相 比 磁 阻 磁头 来 说 电 噪 声 被 降低 。 大 约 在 1998 年 ，IBM 
使 用 巨 磁 阻 磁头 使 得 面 密度 超过 11.6Gb/in"。 这 些 磁头 使 用 感应 器 的 厚度 为 0.04hm，IBM 
声称 如 果 将 感应 器 减 半 至 0.02 pm 则 可 能 达到 40Gb/in? 的 密度 。 高 记录 密度 的 优点 是 磁盘 的 
物理 尺寸 和 功 耗 可 以 减少 ， 进 而 提高 数据 传输 率 。 在 给 定 容量 下 ， 如 果 磁 盘 较 小 且 读 / 写 头 
较 轻 ， 则 主轴 转速 可 以 进一步 增加 ， 磁 头 机 械 运 动 所 造成 的 延迟 将 可 以 最 小 化 。 

在 读 / 写 磁头 组 件 (如 图 3-19 所 示 ) 
中 , 巨 磁 阻 感应 器 夹 在 两 个 磁 屏 蔽 材料 之 
间 构 成 读 取 部 件 。 这 些 磁 屏蔽 材料 可 以 减 ” 磁 阻 或 者 巨 磁 阻 感应 器 
少 磁盘 不 需要 的 磁场 ， 这 样 磁头 可 以 只 检 gin et 
测 磁头 下 记录 数据 位 的 磁场 。 在 合并 磁头 mire 2 
(merged head) 中 ,第 二 个 磁 屏 项 材料 同时 N/SS NIN SIS : 
实现 了 感应 式 写 磁头 的 功能 。 分 离 读 写 部 磁化 方向 ” 读 部 件 。 感应 写 部 件 
件 的 优势 使 每 个 部 件 可 以 单独 优化 。 合 并 图 3-19 巨 磁 阻 读 写 磁头 的 结构 








waw aa 


Courtesy of Ed Grochowski. 
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3. 精灵 之 尘 

2001 年初， IBM 宣布 了 一 项 磁盘 的 突破 性 技术 可 以 使 磁盘 面 密度 增加 4 倍 。IBM 类 
似 三 明治 那样 使 用 3 层 来 存储 数据 。 最 上 层 是 存储 数据 的 铁 磁 材料 。 最 下 层 是 反 铁 磁 
( antiferromagnetic) 层 。 反 铁 磁 性 发 生 在 原子 排列 与 磁场 平行 但 方向 相反 情况 下 ， 即 与 铁 磁 
性 相反 。 然 而 ， 反 铁 磁 性 效应 非常 弱 。 在 这 两 个 层 之 间 就 是 精灵 之 竺 〈pixie dust)， 该 层 由 3 
个 原子 厚 的 元 素 钉 构成 。 稀 有 金属 钉 与 铂 属 于 同一 族 二 每 年 仅 生 产 :12f， 该 层 只 有 3 个 原子 
厚 可 以 使 少量 的 钉 被 使 用 较 长 一 段 时 间 。 

这 种 三 明治 组 织 被 称 为 反 铁 磁 耦 合 (antiferromagnetically-coupled，AFC) 介质 ， 它 可 
以 将 面 密 度 提升 到 约 100Gb/in2?。IBM 宣称 AFC 介质 可 以 避免 高 密度 数据 衰减 。 超 薄 的 钉 层 
使 得 相 邻 的 两 层 保持 相反 的 磁化 方向 。 相 反 的 磁化 方向 使 得 整个 多 层 结构 看 上 去 比 实际 要 薄 
得 多 。 因 此 ， 可 以 在 AFC 介质 上 更 容易 地 记录 小 而 高 密度 的 数据 位 ， 且 由 于 介质 整体 厚度 
较 薄 而 保持 其 磁化 方向 。 

早 在 1990 年 ，IBM 的 科学 家 已 经 发 现 有 条 原子 构成 的 薄 层 可 以 在 相 邻 无 磁性 的 铁 磁 层 
间 产 生 最 强 的 反 向 耦合 。1997 年 第 一 款 具 有 巨 磁 阻 读 磁 头 的 磁盘 驱动 器 中 就 使 用 了 该 结构 。 

图 3-20a 展示 了 传统 的 磁 表 面 ， 图 3-20b 展示 了 条 原子 组 成 精灵 之 尘 的 AFC 介质 。 
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a) 传统 介质 b) = AFC 介质 
图 3-20， 传 统 介 质 和 AFC 介质 


4. 光 辅助 磁头 

一 种 增加 位 密度 的 方法 是 使 用 光 辅 助 磁头 (optically assisted head)， 借 助 光 读 / 写 CD 
的 技术 来 改善 磁头 的 定位 能 力 。 一 些 含有 稀土 元 素 (W, 4L) 的 化 合 物 在 室温 下 具有 稳定 的 
磁 特 性 和 低 居 里 点 。 这 些 材 料 可 以 被 磁化 ， 就 像 其 他 的 磁盘 涂 层 物 质 一 样 。 如 果 化 合 物 被 加 
热 ， 然 后 放 入 磁场 中 ， 被 加 热 的 区 域 很 容易 被 磁化 为 不 同 的 方向 。 一 般 的 磁化 过 程 通过 控制 
磁场 的 大 小 来 定位 磁化 区 域 。 由 这 些 化 合 物 构成 的 盘 片 表面 ， 其 磁化 过 程 由 加 热 区 域 的 大 小 
控制 一 一 即使 磁场 溢出 也 无 关 紧 要 ， 因 为 表面 上 只 有 被 
加 热 的 区 域 才 会 被 磁化 。 

图 3-21 给 出 了 光学 辅助 写 磁头 的 原理 。 微 小 激光 对 BOOS 
表面 进行 加 热 。 通 过 光纤 和 透镜 组 件 将 激光 引导 至 磁盘 
的 表面 。 激 光束 脉冲 可 以 有 选择 地 对 表面 进行 加 热 。 在 
磁盘 表面 上 方 的 线圈 中 通过 的 电流 将 使 加 热 位 置 磁化 为 
一 个 方向 或 男 一 个 方向 。 

由 伺服 机 构 控 制 的 微 镜 将 激光 点 引导 至 磁盘 表面 。 图 3-21 光 辅 助 磁头 
由 于 可 以 通过 电子 的 手段 控制 微 镜 ， 可 以 引导 光束 在 磁盘 表面 移动 (从 一 条 磁道 移动 至 男 一 
条 磁道 )。 该 技术 可 以 达到 100Gb/in 的 密度 。 
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3.3 磁盘 上 的 数据 组 织 


在 介绍 磁 记 录 过 程 和 磁盘 驱动 器 结构 的 基础 上 :下面 将 介绍 数据 是 如 何 存储 在 磁盘 表面 
的 。 写 磁头 直接 将 数据 写 到 磁盘 表面 。 第 一 代 读 磁头 和 写 磁 头 是 完全 相 辐 的 ， 读 写 操作 使 用 
相同 的 磁头 直到 发 现 磁 阻 效应 。 


当 读 磁头 经 过 磁化 表面 ， 磁 通 量 的 变化 导致 

线圈 中 出 现 感应 电流 ， 并 且 在 线圈 两 端 出 现 电 一 一 
压 。 线 圈 两 端 间 的 感应 电压 与 磁 通 的 变化 率 (rate pg D 写 电流 

of change) 而 不 是 它 的 绝对 值 成 正比 ; 也 就 是 说 ， -| 二 于 二 一刻 一 


只 能 检测 到 磁 通 密度 的 变化 。 b) 记录 的 磁 通 inl 


图 3-22a 和 图 3-22b 给 出 了 写 磁 头 中 写 电流 +v 
的 情况 以 及 磁 表 面 磁化 的 结果 。 图 3-22c 给 出 了 ttf) 
当 磁 记录 表面 通过 读 磁 头 下 方 时 线圈 中 的 感应 电 c) 读 电压 
压 。 图 3-22 中 曲线 是 理想 化 的 ， 更 详细 的 插图 给 图 3-22 写 数据 和 读数 据 
出 了 记录 脉冲 在 现实 中 的 样子 。 

在 磁 表 面 不 能 可 靠 地 存储 一 长 串 的 1 和 0， 这 是 因为 只 有 磁 通 水 平 的 变化 才 会 在 磁头 中 
产生 信号 。 如 果 记 录 00000 或 11111， 两 个 序列 将 会 产生 相同 的 结果 一 一 没有 输出 。 假 设 ， 
需要 存储 串 000111111111110000。 读 磁头 只 能 检测 到 两 个 磁 通 变化 : 开始 的 0 到 1 以 及 最 后 
的 1 到 0( 在 串 中 以 下 划 线 表示 )。 

巨 磁 阻 磁头 可 以 检测 绝对 的 磁化 方向 ， 因 为 即使 固定 的 磁场 也 可 以 使 磁 阻 部 件 产生 可 检 
测 的 低 或 高 的 电阻 。 然 而 ,在 很 长 一 串 的 1 和 0 之 间 不 容易 看 出 轮廓 。 

数字 记录 方式 (包括 磁 记 录 和 光 记 录 ) 在 记录 数据 之 前 进行 编码 ， 这 是 为 了 避免 出 现 记 
录 的 信息 很 难 被 读 取 的 情况 。 特 别 是 它 可 以 避免 记录 一 长 串 的 相同 值 或 者 说 相同 的 磁化 方 
向 ; 也 就 是 说 ， 它 可 以 确保 记录 的 磁 通 量 定期 地 改变 状态 。 编 码 方式 的 限制 是 从 磁盘 中 获取 
数据 波形 的 需求 。 大 多 数 的 编码 方式 被 称 为 自 同步 的 〈(self-clocking)， 这 是 因为 磁 表 面 上 的 
记录 位 包含 足够 的 信息 证 硬件 恢复 (regenerate) 时 钟 波形 ， 可 用 于 对 输入 数据 进行 采样 。 

设计 记录 数据 的 编码 方式 是 一 种 艺术 ， 因 为 必须 考虑 许多 相互 制约 的 需求 ; 
e 需要 通过 减少 用 来 记录 每 一 位 数据 所 需 的 磁 通 翻转 的 数量 来 提高 编码 效率 〈 最 好 的 方 
法 是 每 次 翻转 记录 一 位 )。 

e 需要 使 1 和 0 的 记录 形式 尽 可 能 不 同 ， 这 样 可 以 在 存在 噪声 和 其 他 无 关 信号 的 情况 
下 很 容易 地 区 分 1 和 0。 

e 需要 确保 在 磁 通 翻转 间 没 有 显著 的 差距 来 使 编码 实现 自 同步 。 

© 需要 避免 包含 低频 部 分 的 模式 ， 因 为 处 理 来 自 读 磁头 数据 的 模拟 电路 不 能 很 好 地 处 
理 低频 。 

任意 一 种 数据 记录 编码 都 是 上 述 各 要 求 的 折 中 。 图 3-23 给 出 了 曾经 在 软盘 驱动 器 中 使 
用 的 编码 方法 ， 称 为 改进 频率 调制 (modified frequency modulation，MFM)。 软 盘 驱 动 器 的 
工作 原理 与 硬盘 相同 ， 但 其 磁头 与 软盘 片 磁 表 面 接触 且 旋 转速 度 非常 慢 。 

图 3-23 给 出 了 需要 被 记录 的 位 序列 ; 即 010100111。 时 钟 脉冲 用 来 标记 每 个 位 之 间 的 边 
界 。 编 码 过 程 的 第 一 步 (图 3-23 标识 为 “数据 脉冲 ”的 那 一 行 ) 是 当 被 存储 的 数据 位 为 1 时 
产生 一 个 脉冲 。 如 果 这 些 脉冲 被 直接 用 于 存储 数据 ， 当 输入 流 中 含有 连续 两 个 或 两 个 以 上 的 
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0 时 ， 由 于 没有 记录 数据 而 出 现 问题 。 
被 记录 的 数据 序列 0 |1 [L011o o firri 
时 钟 脉 串 上 由 及 入 和信 | | 


| | | | 
数据 脉冲 | 
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| 
组 合 时 钟 与 数据 脉冲 
记录 数据 过 程 中 - I 
写 磁头 中 的 电流 | 一 | as al 


图 3-23 MFM 编码 


MEM 编码 通过 在 两 个 连续 的 0 间 的 边界 记录 一 个 1 来 解决 缺乏 信号 的 问题 。 这 条 规则 
确保 一 串 0 也 能 产生 磁 通 翻转 ， 但 是 被 插入 脉冲 不 能 被 解释 为 一 个 1， 因 为 它 介 于 信息 域 的 
边界 ， 而 不 是 信息 域 的 中 间 。 图 3-23 中 最 下 面 一 行 表示 的 是 写 磁 头 中 的 电流 ， 它 在 每 个 肪 
冲 处 改变 方向 。 

改进 频率 调制 编码 在 20 世纪 80 年 代 广 泛 应 用 于 硬盘 ,但 目前 已 经 被 更 好 的 编码 方式 取 
代 。 游 程 长 度 受 限 (Run Length Limited, RLL) 码 ， 比 MFM 编码 更 复杂 ， 但 它 减 少 了 存储 
数据 所 需 的 磁 通 翻转 。 该 编码 将 数据 位 映射 到 磁 通 翻转 模式 ,但 限制 了 0 序列 的 最 大 长 度 。 
例如 ，2,7 RLL 码 将 编码 中 0 序列 的 长 度 限 制 在 2 ~~ 7 个 。 现 代 的 RLL 编码 为 3,9 RLL, 将 
0 序列 的 最 大 长 度 限制 为 9。 

今天 的 磁盘 驱动 器 在 记录 数据 之 前 采用 更 加 复杂 的 编码 方法 ， 在 读 出 编码 后 进行 译 
码 。 特 别 是 ，Hitachi 公司 在 20 世纪 90 年 代 率 先 使 用 部 分 响应 最 大 似 然 (Partial Response 
Maximum Likelihood, PRML) 技术 来 处 理 从 磁盘 中 读 取 的 数据 。 早 期 的 记录 技术 包括 ， 对 
数据 进行 编码 ， 将 其 写 到 磁 介 质 上 ,使 用 简单 的 峰值 检 波 器 从 读 磁 头 中 读 取 脉冲 以 得 到 1 或 
者 0。 然 而， 高 速 操作 时 ， 由 于 磁 通 翻转 从 磁盘 读 取 的 数据 是 复杂 的 模拟 波形 而 不 是 漂亮 的 
方 波 。 此 外 ， 如 果 每 位 记录 得 很 近 ， 磁 通 翻 转 信 号 的 过 渡 部 分 将 重 释 在 一 起 并 相互 干扰 。 每 
位 之 间 的 相互 作用 被 称 为 码 间 干扰 (intersymbol interference)， 这 是 自 20 世纪 60 年 代 一 直 
困扰 电话 信道 调制 解 调 器 设计 者 的 问题 。PRML 技术 涉及 从 读 磁头 读 回 模拟 信号 ， 并 使 用 信 
道 特性 的 知识 ( 即 由 单 脉冲 生成 波形 的 知识 ) 来 重 构 原 始 数据 。 最 大 似 然 这 个 词 表 明 ， 译 码 
器 选择 最 有 可 能 生成 接收 数据 的 数据 记录 模式 。 这 种 技术 也 被 称 为 Viterbi 译 码 ， 它 在 存在 
噪声 的 条 件 下 非常 有 效 。 


3.3.1 磁道 和 扇 区 


前 文 已 经 说 明 ， 磁 盘 表 面 划分 为 许多 磁道 。 一 条 磁道 被 划分 为 若干 扇 区 ， 扇 区 是 从 磁盘 
读 写 数据 的 最 小 单位 ;因为 没有 办 法 在 磁道 上 定位 某 一 位 然后 再 修改 它 。 由 于 没有 将 磁盘 旋 
转 的 速度 保持 为 精确 的 恒定 速度 (实际 生产 情况 也 不 允许 )， 有 必要 一 次 读 取 一 个 数据 块 。 

磁盘 驱动 器 是 一 种 机 械 装置 ， 写 磁头 无 法 精确 定位 到 某 个 鹿 区 。 磁 头 总 有 可 能 向 左 或 者 
向 右 偏 移 ， 磁 头 写 的 扇 区 可 能 略微 超前 或 者 滞后 于 需要 被 覆盖 的 扇 区 。 
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高 级 文件 格式 TRA Sh Be. SE reg set io: PR ee Sh Se Ee A Sas eee 
”为 了 提高 磁盘 驱动 器 的 数据 密度 ，Samsung rere (Advanced Forma 
它 不 使 用 标准 的 512 SHAR HRM 4096 FH HRB. KHARAT TH Ko Bl 
% 4096 个 字 节 而 不 是 每 512 字 节 需要 一 个 错误 校正 码 。 
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当 从 扇 区 读 取 数 据 时 ， 记录 的 信号 中 包含 先前 的 写 操作 (或 更 早 以 前 的 写 操作 ) 留 下 的 
一 小 部 分 数据 。 从 这 些 由 于 磁头 写 操 作 略 有 偏 移 而 遗留 的 旧 扇 区 中 读 取 的 信号 非常 弱 ， 不 足 
以 影响 到 磁盘 的 操作 ， 它 不 会 成 为 问题 ， 除 非 磁头 偏 移 得 很 厉害 。 

考虑 从 读 磁头 获取 模拟 信号 ， 构 建 相 应 的 数据 模式 。 然 后 使 用 已 知 磁头 特性 的 相关 知识 
重组 所 记录 的 数据 信号 ， 将 获得 所 记录 数据 的 完美 副本 ， 而 且 是 没有 任何 多 余 信 号 的 副本 。 
如 果 将 从 数据 中 构建 的 信号 与 从 读 磁 头 中 获得 的 信号 相 减 ， 就 可 以 得 到 上 述 由 于 磁头 偏 移 写 
和 人 同一 个 扇 区 的 先前 微小 信和 号。 

正 前 所 述 ， 扇 区 偏 移 意 味 着 写 操作 不 能 根除 旧 的 数据 。 因 为 以 前 写 和 人 同一 扇 区 的 留 下 的 
信号 水 平 太 弱 ， 不 至 于 损坏 数据 ,所 以 实际 上 不 构成 问题 。 然 而 ，FBI 的 专家 能 够 读 取 被 删 
除 的 文件 ， 他 可 能 不 愿意 相信 ， 从 哥伦比亚 订购 的 包 夺 真 的 是 妈妈 的 肉 饼 秘方 。 

用 户 可 以 订购 用 来 安全 地 删除 数据 的 程序 。 它 们 解决 数据 不 能 完全 被 删除 的 方法 是 ， 不 
断 地 将 随机 的 数据 写 入 同一 磁道 ， 直 到 多 个 写 操作 已 完全 毁灭 所 有 先前 写 的 数据 。 

该 操作 与 恢复 (undelete) 文件 操作 不 同 ， 文 件 可 以 被 恢复 是 因为 它 仅 仅 是 简单 地 从 目 
录 中 删除 ”其 内 容 仍然 存在 磁盘 上 。 

图 3-24 给 出 了 磁道 的 结构 。 从 存储 效率 考虑 ， 
扇 区 应 该 尽 可 能 地 大 。 因 为 每 个 扇 区 包含 管理 专用 信 
息 ， 小 的 扇 区 由 于 浪费 了 磁盘 空间 而 导致 效率 低下 。 
从 存储 效率 考虑 ， 扇 区 也 应 该 尽 可 能 地 小 。 由 于 肩 区 
是 数据 存 取 的 最 小 单位 ， 文 件 存储 的 粒度 单位 都 是 扇 
区 。 如 果 增 加 文件 的 大 小 ， 就 会 导致 文件 所 使 用 扇 区 
数量 的 增加 。 如 果 最 小 的 扇 区 (比方 说 是 4KB), 这 意 
味 着 ,平均 而 言 ， 一 个 文件 的 最 后 一 个 扇 区 只 有 一 半 
存储 了 有 用 的 信息 。 如 果 磁 盘 有 成 千 上 万 的 文件 ， 浪 
费 空间 将 非常 大 。 当 然 ， 上 述 两 种 说 法 是 相互 矛盾 的 。 最 优 扇 区 大 小 往往 是 一 种 折 中 。 

扇 区 是 保持 基本 数据 单元 的 数据 结构 。 当 磁盘 首次 使 用 时 ， 扁 区 将 被 写 到 磁盘 表面 ; 也 
就 是 说 ， 扇 区 是 软件 结构 而 不 是 磁盘 的 物理 特性 。 

图 3-25 给 出 了 磁盘 被 首次 格式 化 (format) 时 写 到 磁盘 中 磁道 的 结构 该 图 为 软盘 的 扇 
区 结构 ,很 容易 理解 )。 直 到 有 了 这 种 结构 ， 磁 盘 才 能 用 来 记录 数据 。 存 储 数据 所 需 的 开销 
与 半导体 存储 器 不 同 。 

间隙 中 没有 有 用 的 信息 ， 但 为 了 给 磁头 自身 与 来 自 读 / 写 头 的 位 流 同 步 时 间 ， 这 些 磁 道 
上 不 同 域 之 间 的 间隙 是 必要 的 。 由 于 磁 介 质 本 身 不 可 靠 ， 为 了 检测 已 经 损坏 的 数据 需要 使 用 
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图 3-24 磁道 的 结构 
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错误 检测 码 。 在 图 3-25 中 ， 磁 道 包 含 索引 、 地 址 和 数据 标记 (mark)。 这 些 标 记 是 记录 在 磁 
盘 上 特殊 的 非法 二 进 制 模式 〈 说 它们 是 非法 的 ， 是 因为 它们 不 符合 用 于 存储 数据 的 数据 编码 
算法 )。 因 此 ， 硬 件 可 以 很 容易 地 检测 这 些 标 记 并 使 用 它们 来 同步 读 或 写 操作 。 

索引 地 址 标记 


HX 1 
[15 ps ESE BK? rer 
ca.. 2 f= 








ID 地 址 ”磁道 扇 区 me 


m 5 e 
标记 地 址 mi 编号 
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图 3-25” 扇 区 结构 实例 
ORE oe Rie Ale ES cP SE Set et ea 3 
TT ARA ATERSE 则 高 区 的 长 度 : 
gt Pm AEN RE PAER. 人 





pi epee Fer te PARAMLMBRTREATAREN, 
DRIP MEM AR TRAKK WET AAE kaiho oa 
磁盘 利用 分 区 (zoning) 来 处 理由 于 不 同 磁道 长 度 而 导致 的 问题 ， Se 
一 个 区 (zone)， SNERATAREO AE. REDARRA EMD A 30 个 或 更 多 
的 区 。 A ; 
be TEETAR RREN anaana san af kT AL 
_ 读 取 最 外 磁道 时 的 传输 率 少 约 BO% a caer 2 





1. 格式 化 磁盘 

第 一 代 硬 盘 和 软盘 需要 用 户 执行 低级 格式 化 (1low level format)， 这 是 因为 磁盘 二 没有 写 
上 磁道 / 扁 区 结构 。 现 代 高 性 能 硬盘 并 不 是 这 样 ， 因 为 它们 在 出 厂 前 已 经 进行 了 格式 化 党 磁 
盘 驱 动 器 可 能 具有 比 前 面 描述 的 更 为 复杂 的 磁道 结构 。 例 如 ;靠近 内 部 的 磁道 可 能 由 于 周 长 
小 而 具有 较 少 的 扁 区 (分 区 记录 ); 或 者 某 些 扇 区 因为 包含 了 记录 表面 有 缺陷 的 地 方 而 被 转 
起 ( 即 看 不 见 )。 早期 磁盘 驱动 器 比 今天 的 磁盘 接口 、 设 备 驱动 和 操作 系统 出 现 得 更 早 。 那 
时 用 户 必须 创建 自己 的 数据 结构 ， 执 行 格式 化 ; 并 按照 位 的 级 别 来 读 / 写 数据 。 今 天 ， 磁 盘 
驱动 器 是 一 个 接收 来 自 操作 系统 命令 的 黑 盒 子 。 用 户 不 必 关 心 数 据 是 如 何 编 码 和 存储 的 。 

一 旦 磁盘 通过 低级 格式 化 具有 了 磁道 和 扁 区 结构 , 它 可 以 进行 高 级 格式 化 (high level 
format)。 高 级 格式 化 包含 操作 系统 所 需 的 数据 结构 。 因 此 ， 不 同 操作 系统 的 高 级 格式 化 结 
果 可 能 不 同 。 在 PC 二 格式 化 磁盘 的 操作 就 是 一 种 高 级 格式 化 。 

Al 3-26 显示 了 如 何 从 磁盘 读 取 文件 。 一 个 文件 是 由 一 系列 的 扇 区 组 成 。 扇 区 本 身 可 以 


ZAR eB 113 


被 组 织 成 一 个 链表 (linked list) 或 目录 用 来 定义 属于 某 一 文件 的 扇 区 序列 。 图 3-26 表明 ， 
在 读 文 件 时 可 能 会 而 现 户 区 对 应 菩 道 如 发 生变 化 ， 重 新 寻 道 导 
致 浪费 了 大 量 的 时 间 。 当 首次 创建 文件 时 ， 它 被 分 配 在 连续 的 
扇 区 中 。 经 过 一 段 时 间 的 文件 创建 和 删除 ,磁盘 上 可 用 扇 区 高 
度 分 散 ， 导 致 文件 被 严重 分 散 。 幸 运 的 是 ， 操 作 系 统 可 以 定 其 
自动 或 手动 整理 文件 ， 重 组 它们 的 结构 以 减少 寻 道 时 间 。 

2. 交叉 

磁道 的 扇 区 按照 0，1，2，…，n-1 进行 编号 并 被 称 为 物理 
，( physical) 扇 区 。 假 定 操作 系统 需要 读 取 几 个 扇 区 。 如 果 首 先 ， 图 3-26 文件 可 能 包含 分 散在 
读 取 扇 区 x， 在 读 取 扇 区 x 结束 及 开始 读 取 扁 区 x+1 之 间 ， 磁 磁盘 中 的 多 个 肩 区 
盘 驱动 器 电子 机 构 需要 做 相当 多 的 工作 。 今 天 这 已 经 不 是 一 个 问题 ， 因 为 磁盘 的 旋转 速度 相 
对 磁盘 电子 机 构 中 嵌入 的 高 速 16 位 处 理 器 来 说 十 分 缓慢 。 扇 区 间 的 间隙 对 任意 事务 处 理 来 
说 都 是 足够 的 。 但 历史 上 并 非 总 是 如 此 早期 的 磁盘 驱动 器 内 部 处 理 较 少 ,计算 机 的 速度 很 
慢 。 当 处 理 器 准备 读 取 扇 区 x+1 时 ， 磁 头 正在 通过 该 扇 区 (甚至 已 经 在 该 扇 区 之 前 )， 因 此 
需要 等 待 扇 区 x+1 的 起 点 再 次 旋转 到 磁头 下 方 。 采 用 的 解决 方案 是 将 连续 的 逻辑 扇 区 映射 到 
交叉 的 物理 扇 区 上 。 例 如 ， 按 照 1:2 交叉 的 ,17 个 逻辑 肩 区 在 磁盘 上 的 分 布 可 能 是 : 

0529-4) 4533.0, 72ys Hs 33 sd aed 134) 5,904,565) 1538 Fal 6s 

(PE REAL 4 ATE CEG 4, FE 5, TE POR RE 13% 
这 种 安排 让 计算 机 在 扇 区 5 移动 在 磁头 下 方 之 前 有 时 间 来 执行 事务 处 理 。 当 前 的 磁盘 使 用 
1:1 交叉 ， 用 户 不 再 需要 关注 交叉 的 问题 。 此 外 ， 高 速 缓存 和 缓冲 技术 使 得 交叉 成 为 元 余 ， 
因为 可 以 缓冲 整个 磁道 。 


3.3.2 ”磁盘 参数 和 性 能 


到 目前 为 止 ， 本 书 还 没有 讨论 磁盘 驱动 器 的 任何 操作 参数 的 细节 或 性 能 。 R 3-1 分 别 给 
出 了 一 个 120GB、 一 个 2TB 和 一 个 3TB 的 磁盘 驱动 器 的 特点 。 
表 3-1 120GXB. 7K2000 5 7K3000 硬盘 驱动 的 参数 


参数 120GXB Deskstar 7K2000 Deskstar 7K3000 
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参数 120GXB Deskstar 7K3000 
持续 数据 传输 率 /MB/s 23-48 (0-30 X) 134 
平均 寻 道 时 间 /ms 
磁道 间 最 小 移动 时 间 /ms 
磁道 间 最 大 移动 时 间 /ms 


终端 用 户 对 磁盘 驱动 器 的 3 个 方面 感 兴趣 : 它 可 以 存储 多 少数 据 ， 需 要 多 长 时 间 来 访问 
数据 ， 以 及 如 何 将 数据 移动 到 主机 。 磁 盘 容 量 (capacity) 的 计算 公式 为 : WR x 每 面 的 磁 
道 数 x 每 磁道 的 扇 区 数 x BKK. 

磁盘 的 访问 时 间 (access time) 主要 由 两 部 分 组 成 : 访问 给 定 磁道 的 时 间 ， 即 寻 道 时 间 
(seek time); 找到 磁道 后 访问 给 定 扇 区 的 时 间 ， 即 延迟 (latency), IERRA DHA. ik 
磁头 已 经 移动 到 给 定 磁 道 ， 最 小 的 延迟 就 是 零 ( 扇 区 刚好 到 达 磁 头 下 方 )。 最 大 延迟 是 旋转 
一 圈 的 时 间 《 磁 头 刚刚 错过 了 该 扇 区 ， 必 须 等 待 它 转 回来 )。 平 均 来 说 ， 延 迟 为 1/2t..,， 其 中 
bey 为 磁盘 旋转 一 周 的 时 间 。 如 果 磁 盘 转速 为 7200rpm， 该 延迟 为 : 

1/2 X 17200 + 60)=0.00417s=4.17ms 

平均 旋转 延迟 只 能 通过 增加 磁盘 的 转速 来 降低 。 磁 盘旋 转 所 需 能 量 与 转速 的 平方 成 正 
比 。 此 外 ， 旋 转 磁 盘 的 应 力也 与 转速 的 平方 成 正比 。 磁 盘旋 转 的 最 大 速度 由 其 能 量 需求 和 机 
械 特 性 决定 。 构 造 磁盘 材料 的 自然 属性 将 决定 其 最 大 转速 。 近 些 年 来 ,磁盘 的 速度 变化 相对 
较 小 。2004 年 ， 低 价 的 商用 硬盘 的 转速 为 5400 转 (取代 旧 的 3600 转 标 准 )， 高 性 能 磁盘 的 
转速 为 7200 转 。 某 些 昂贵 的 硬盘 是 为 10000 转 ， 而 最 先进 的 磁盘 为 15000 转 。 在 接 下 来 的 
10 年 中 变化 应 该 不 大 。 

什么 是 平均 寻 道 时 间 ? 如 果 磁 盘 有 N 条 磁道 ， 磁 道 间 移动 时 间 为 ks。 如果 磁头 在 每 次 
寻 道 后 停 在 磁盘 的 边缘 ， 寻 找 给 定 磁 道 需要 经 过 磁道 的 平均 值 为 W2， 则 平均 寻 道 时 间 的 计 
算 公 式 为 %WxNx ts 图 3-27a 说 明了 这 种 情况 。 

但 是 ， 如 果 磁 头 在 每 次 访问 后 自动 移动 到 所 有 磁道 的 中 心 位 置 (磁道 号 为 N/2 )， 如 
图 3-27b 显示 。 当 开始 新 的 寻 道 操作 时 ， 磁 头 可 以 向 左 或 向 右 移动 。 在 这 种 情况 下 ， 寻 找 给 
定 磁道 所 需要 经 过 磁道 的 平均 值 为 N/4， 平 均 寻 道 时 间 变 为 % x N x topo 





中 间 磁 道 





a) 磁头 停靠 在 磁盘 边缘 ， b) 磁头 停靠 在 磁盘 中 间 ， 
经 过 的 平均 磁道 数 为 N/2 经 过 的 平均 磁道 数 为 N/4 


图 3-27， 寻 道 时 间 和 磁头 初始 位 置 
在 实践 中 ， 读 写 头 停留 在 访问 后 的 位 置 ， 所 以 新 的 寻 道 时 间 有 时 长 有 时 短 s 下 面 计算 平 
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均 访问 时 间 。 假 定 磁 头 停留 在 磁道 二 (i 为 0 一 N-1 的 任意 整数 )， 磁 头 必 须 二 步 步 定 位 到 给 
定 磁道 。 磁 头 移动 到 每 个 可 能 的 目的 地 所 需 步 数 如 下 : 
磁头 终点 0 1 2 ns i-l i i+1 es o N-2 N-1 
经 过 磁道 数 ” i-1 i-2 i-3 e 1 0 1 = N-i-1 N-i 
到 每 个 可 能 的 目的 地 所 需 步 数 的 总 和 为 : 
i—1+i—2+:--+3+2+1+0+1+2+3+---N-i : 
使 用 等 差 数列 求 和 公式 1+2+3+…+k=1/2k(k+1)， 可 以 得 到 磁头 移动 到 每 个 可 能 的 目的 地 
所 需 步 数 的 总 和 。 
所 需 步 数 的 总 和 =1/2xi(itl)+1/2 (N-i)(N-i4+1 ) 
=1/2 (P+i+N?°—-Ni+N-Ni+i—i) 
=1/2 (27°+N?—2Ni+N) 
平均 所 需 步 数 为 总 和 除 以 磁道 的 数量 。 也 即 : 
平均 经 过 的 步 数 =1/2 (27°+2N’-2NitN) /N 
最 后 就 是 利用 所 有 可 能 的 i 值 来 计算 平均 值 。 也 即 


2N 
如 果 N 很 大 ,可 以 将 上 式 简化 为 : 

1 

2N? 

WR i 是 连续 变化 的 整数 ， 每 次 寻 道 需要 经 过 的 平 
均 磁 道 数 为 WV3。 实 际 上 ， 人 情况 并 非 这 么 简单 ， 因 为 磁 
头 并 不 是 以 恒定 速率 通过 磁盘 表面 。 当 音 圈 (voice-coil) 
电机 旋转 ， 磁 臂 扫 过 磁盘 表面 ， 磁 臂 会 加 速 和 减速 ， 而 
不 是 以 恒定 的 速度 移动 。 图 3-28 展示 了 磁 臂 从 最 外 图 
磁道 扫 过 磁盘 表面 到 达 最 内 圈 磁道 的 情况 。 

图 3-28 展示 了 具有 可 转动 磁 臂 的 磁头 运动 情况 ， 
磁头 部 分 时 间 在 加 速 ， 部 分 时 间 在 磁盘 表面 以 相同 的 速 
度 滑行 ， 部 分 时 间 在 减速 因为 它 即将 到 达 目的 地 。 图 3-28 磁头 的 移动 

很 难 给 出 磁头 在 磁道 间 移 动 的 确切 时 间 。Wilkes 和 Ruemmler 通过 建立 磁盘 驱动 器 的 
模型 指出 ， 相 比 认为 磁头 是 线性 运行 而 言 ， 假 定 磁头 运动 为 加 速 、 滑 行 和 减速 会 更 好 。 这 3 
段 区 域 的 相对 长 度 取 决 于 磁头 需要 移动 的 距离 。 例 如 ， 短 的 移动 距离 没有 滑行 阶段 ， 因 为 磁 
头 的 速度 还 没有 加 上 去 。 

Wilkes 和 Ruemmler 为 转速 为 4000rpm 的 HP C2200A 驱动 器 建立 了 一 个 简单 的 模 
型 。 短 距离 移动 4 个 磁道 所 需 的 寻 道 时 间 为 3.14+0.5597YV4ms， m 4 比较 大 时 寻 道 时 间 为 
10.8+0.0124dms。 可 见 ， 当 移动 的 磁道 数 比较 大 时 寻 道 时 间 是 线性 的 ， 而 移动 的 磁道 数 比 较 
小 时 寻 道 时 间 与 其 平方 根 成 正比 。 这 些 数 字 是 正 是 符合 人 们 已 知 的 结论 一 一 距离 与 加 速度 之 
间 的 基本 关系 为 : 距离 =1/2 - 加 速度 fo 





i=N 
> 2 +N?’ -2Ni) 
0 
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1. 访问 扇 区 

如 果 磁 盘 驱动 器 顺序 读 取 物 理 上 相 令 的 扁 区 ， 数 据 传 输 率 为 〈 扇 区 大 水 )/:( 读 取 二 个 扇 
区 的 时 间 )。 实 际 上 ， 理 想 的 上 限 一 般 不 能 达到 。 由 于 文件 创建 及 修改 ， 文 件 被 分 散在 不 连 
SEA Po 此 外 ,计算 机 在 程序 执行 过 程 中 可 能 需要 访问 许多 不 同类 型 的 数据 : 代码 、 子 
程序 库 以 及 帮助 文件 等 。 具 有 多 任务 操作 的 系统 情况 其 至 更 糟 。 它 们 必须 应 付 完全 不 同 程序 
的 请 求 ， 而 这 些 程序 使 用 毫 不 相关 的 数据 。 最 坏 情况 下 ， 磁 盘 在 访问 扇 区 间 可 能 要 随机 寻 道 
(由 于 采用 数据 缓存 通常 不 会 发 生 这 种 情况 )。 

虽然 磁盘 数据 的 测序 属于 操作 系统 的 领域 ， 这 里 给 出 操作 系统 访问 数据 的 一 个 短 序列 来 
说 明 体系 结构 -硬件 - 软件 之 间 的 权衡 。 

假设 操作 系统 向 磁盘 驱动 器 的 磁道 50、 150、32、 16、125、8、130、50、60、200 
发 出 一 系列 请 求 。 图 3-29 画 出 了 根据 磁道 顺序 依次 访问 一 一 先 来 先 服务 ( first come first 
serive, FCFS) 时 磁头 的 位 置 。 

操作 系统 通常 为 磁盘 驱动 器 提供 支持 。 例 如 ”图 3-30 中 情况 与 图 3-29 中 基本 相同 ， 除 
了 磁道 被 缓冲 ， 磁 头 首 先 按照 一 个 方向 运动 然后 再 按照 另 一 个 方向 运动 。 表 3-2 给 出 了 磁 臂 
在 这 两 个 阶段 中 扫 过 的 磁道 的 数量 。 可 见 ， 对 访问 顺序 重新 排序 将 大 大 减少 磁头 的 移动 。 下 
面 为 几 种 典型 的 磁盘 调度 算法 。 在 每 种 情况 下 ， 寻 道 的 顺序 为 10、19、3、14、12 和 9。 













oot 50 150 32 16 125 8 130 50 60 2 


60 125 130 150 200 50 50 32:16 8 
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寻 道 顺序 寻 道 顺序 
3-29 ”访问 磁道 的 顺序 (FIFO/FCFS) 图 3-30 - 非 顺序 访问 (SCAN) 
表 3-2 访问 10 个 扇 区 经 过 的 磁道 数量 
总 计 
顺序 访问 

磁道 50 150 32 16 125 8 130 50 60 200 
经 过 磁道 数 100 118 16 109 117 122 80 10 140 812 

SCAN 

磁道 60 125 130 150 200 50 50 32 16 8 
经 过 磁道 数 65 5 20 50 150 0 18 16 8 332 


FIFO 一 一 先进 先 出 (First-in-first-out) 也 称 为 先 来 先 服务 (first come first serive, FCFS). 
该 算法 处 理 请 求 的 顺序 与 其 接收 的 顺序 相同 。 它 对 所 有 进程 来 说 是 公平 的 。 访 问 顺序 为 10、 
19、3、 14,12, 9. 平均 寻 道 长 度 为 8.2。 

SSTF 一 一 最 短 寻 道 时 间 优 先 (shortest seek time first), 下 一 次 寻 道 的 目的 地 是 最 接近 
当前 磁头 的 位 置 。 该 算法 将 磁头 需要 最 小 移动 的 请 求 作为 下 一 个 请 求 。 由 于 新 的 请 求 可 能 在 
老 的 请 求 之 前 被 服务 ， 这 是 不 公平 的 。 访 问 顺序 为 10、12、14、19、9、3。 平均 寻 道 长 度 
为 :0 
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SCAN 一 一 该 方法 与 电梯 算法 类 似 ， 先 完成 同方 向 最 接近 的 请 求 。 它 先 满足 所 有 与 当前 
磁头 运动 方向 相同 的 请 求 然 后 再 改变 方向 。 访 问 顺序 为 10、12、14、19、9、3。 平均 寻 道 
长 度 为 5.0。 

LOOK 
变 方向 。 

C_SCAN 一 一 该 扫描 算法 先 向 一 个 方向 移动 ， 扫 过 整个 磁盘 。 然 后 返回 到 磁盘 的 男 一 边 
重新 开始 扫描 。 这 是 SCAN 的 单 向 版 。 访 问 顺序 为 10、12、14、19、3、9。 平均 寻 道 长 度 
为 6.2。 

FSCAN 一 一 该 算法 旨 在 处 理 磁 辟 粘着 (arm stickiness)。 它 需要 两 个 请 求 队列 。 初始 情 
况 下 ;在 扫描 开始 时 ， 所 有 请 求 加 入 一 个 队列 ， 而 男 一 个 队列 为 空 。 扫 描 过 程 中 ， 所 有 新 的 
请 求 放 在 另外 一 条 队列 。 这 种 机 制 将 延缓 所 有 新 的 请 求 ， 直 到 现 有 队列 中 的 请 求全 部 被 服 
务 。 当 然 ， 这 是 一 种 公平 的 访问 机 制 。 

注意 ， 这 些 算法 的 效率 会 由 于 寻找 扇 区 而 增加 的 旋转 延迟 时 间 而 打折 扣 。 

2. 内 部 磁盘 缓存 

现在 磁盘 驱动 器 都 包含 一 个 RAM 缓冲 区 ， 称 为 磁盘 cache (disk cache), CRM REA 
ERNE. XP ARAA (internal cache) 与 操作 系统 设置 的 磁盘 缓存 并 不 相同 一 一 尽管 
它们 具有 类 似 的 功能 。 硬 盘 的 内 部 缓存 用 来 保存 最 近 读 操作 得 到 的 数据 。 缓 存 其 至 还 可 以 被 
编程 来 预 取 在 不 久 的 将 来 可 能 需要 数据 ; 也 就 是 说 ,磁盘 可 以 在 给 出 读 取 特定 扇 区 的 命令 之 
HERA. HR, 一旦 开始 读 取 扇 区 ,该 扁 区 的 内 容 就 会 被 缓存 ， 直 到 缓冲 区 已 满 。 一些 
内 部 缓存 的 存储 器 使 用 活动 分 割 ( activity segmentation) 机 制 ， 其 缓存 的 数据 块 的 大 小 是 可 
变 的 。 这 人 允许 缓存 可 以 适应 正在 被 执行 的 访问 类 型 。 

通过 从 cache 中 而 不 是 从 磁盘 本 身 获取 数据 ，cache 可 以 减少 磁头 移动 和 寻 道 操作 来 提 
高 驱动 器 的 性 能 。 典 型 的 驱动 器 有 8MB ~ 64MB 的 内 部 cache。 磁 盘 cache 可 以 减少 驱动 器 
的 平均 访问 时 间 ; 但 是 ， 对 磁盘 碎片 的 随机 访问 不 能 充分 利用 cache 而 提高 性 能 。 

还 可 以 缓存 对 磁盘 的 写 访问 。 在 写 操作 时 缓存 数据 可 以 节省 时 间 ， 因 为 一 旦 数据 被 缓 
存 ， 磁 盘 驱 动 器 就 可 以 将 完成 (finished) 信号 返回 给 主 控制 器 。 磁 盘 然 后 自己 将 数据 从 缓存 
写 和 人 磁盘 表面 : 这 种 机 制 被 称 为 写 回 (write-back) 缓存 。1999 年 IBM 在 其 Ultrastar 18LZX 
和 36ZX 磁盘 驱动 器 中 实现 了 完整 的 写 缓 存 。 该 特性 可 以 从 服务 器 通过 驱动 接口 开启 和 
关闭 。 | 

不 幸 的 是 ， 写 回 缓存 会 导致 糟糕 的 意外 。 如 果 在 缓存 数据 和 写 数据 操作 之 间 掉 电 ， 数 据 
就 会 丢失 。 更 糟糕 的 是 ;已 经 通知 主机 进行 了 写 操作 ， 主 机 并 不 知道 发 生 了 问题 a 这 将 导致 
文件 一 致 性 问题 ， 会 带 来 严重 的 后 果 。 因 此 写 缓存 并 没有 被 广泛 使 用 。 当 系统 具有 不 间断 电 
源 时 ， 写 缓存 才 会 成 为 某 些 磁盘 的 选项 。 

3. 传输 速率 

磁盘 用 户 感 兴趣 的 另 一 个 参数 是 磁盘 存 取 数据 的 速率 (rate)。 该 参数 很 容易 计算 。 如 
果 磁 盘 的 转速 为 尺 转 /min， 每 条 磁道 有 s 个 扇 区 ， 每 个 扇 区 包含 了 位 ， 磁 道 的 容量 为 3 s 
位 。 这 些 位 在 60/R 秒 内 被 读 (或 写 )。 因 此 ， 数 据 传输 速率 为 : 

BsR 
See 
典型 的 驱动 器 ， 例 如 Deskstar 7K3000, FEH 7200rpm, 读 取 介质 时 磁盘 最 大 数据 传 





这 是 对 SCAN 简单 的 修改 ， 它 通过 软件 监测 ， 在 当前 磁道 前 方 没有 请 求 时 改 
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送 速率 为 1656Mb/s。 而 磁盘 接口 的 最 大 数据 传输 速率 为 600MB/s ( 即 4800Mb/s) 。 


3.3.3 SMART 技术 


GPU 是 一 种 具有 大 约 10 一 3x10? 个 晶体 管 的 复杂 半导体 器 件 。 商 业 压力 迫使 制造 商 
在 最 短 的 时 间 内 最 小 化 设计 、 开 发 和 测试 周期 来 进行 生产 。 人 们 其 实 并 不 关注 CPU 是 否 能 
高 效 地 工作 ;而 是 关注 其 是 否 能 正常 工作 。 如 果 CPU 失效 ,将 成 为 相当 大 的 麻烦 a 用 户 将 
订购 一 个 新 的 芯片 ， 打 开机 箱 ， 取 出 旧 的 CPU， 插入 新 的 。 

硬盘 是 使 用 前 沿 技术 操作 的 复杂 机 电 设 备 。 机 电 系 统 的 可 移动 部 分 比 其 半导体 部 分 的 可 
靠 性 要 低 。 主 要 的 磁盘 制造 商 开 发 了 SMART 技术 ， 用 来 监控 硬盘 驱动 器 的 性 能 ， 可 以 预测 
失效 的 可 能 性 ， 从 而 为 用 户 提供 可 能 出 现 失效 的 预警 。SMART 是 自 监测 、 分 析 和 报告 技术 
(Self-Monitor Analysis and Reporting Technolog) “的 简称 。 

IBM 和 Compaq 公司 都 独立 开发 了 自己 的 SAMRT 的 初级 形式 ， 然 后 将 其 专业 知识 和 技 
术 整 合 在 一 起 形成 了 SMART. IBM 的 预测 故障 分 析 (predictive-failure analysis, PFA) 使 
用 磁头 飞行 高 度 等 参数 的 测量 值 来 指示 可 能 的 失效 。Compaq 与 Seagate 和 Quantum 一 起 开 
发 了 IntelliSafe 技术 来 测量 驱动 参数 ,并 与 预先 设 定 的 阔 值 进行 比较 二 如果 超过 阔 值 ;就 会 
将 状态 消息 发 送 到 主机 。 每 个 驱动 器 的 参数 和 浆 值 都 不 相同 ,但 将 状态 发 送 给 主机 的 方式 对 
所 有 系统 都 是 基本 一 致 的 。SMART 技术 的 实现 (比如 IntelliSafe) AAS MF, 这 是 因为 驱 
动 器 的 体系 结构 不 断 创 新 ， 某 些 驱动 器 比 其 他 驱动 器 更 加 适合 关键 任务 (mission critical) 的 
应 用 。 

某 些 电子 故障 是 突然 出 现 和 无 法 预测 的 a 机械 问题 相对 来 说 可 以 预测 。 在 日 常生 活 中 ， 
汽车 驾驶 员 可 以 观察 汽车 轮胎 的 松弛 和 刚度 状况 以 及 油 位 情况 。 所 有 这 些 参 数 给 出 了 关于 汽 
车 状态 的 有 价值 的 信息 。 磁 盘 驱 动 器 的 某 些 参数 也 可 以 用 来 指示 可 能 的 失效 。 











“SMART 参数 ; 

beh de MAREA SARE SMARTARRAT LA SMART ROSS. RA, 
“这 些 参数 都 是 在 磁盘 老化 后 用 来 检测 迟钝 情况 的 。 下 列 是 其 中 的 一 些 参 数 。 | 
行 高 度 碳 盘 上 动 器 最 关键 的 参数 之 一 是 读 / 写 碰头 在 磁盘 表面 上 的 高 
B 非常 小 ， 大 约 为 微 英寸 (yin) 量 级 。 磁 头 一 表面 高 度 由 磁盘 旋转 时 表面 的 
空气 流动 控制 。 过 低 的 间隙 使 役 头 具有 撞击 旋转 磁盘 表面 并 破坏 磁盘 表面 的 危险 。 过 高 
的 间距 使 从 磁 表 面 读 出 的 信号 太 弱 ， 来 自 多 个 位 的 信号 有 可 能 会 相互 影响 ， 写 信号 的 强 
A E ee din ni 









“RET ASA A MAR RAR MA BORLA. snanar 
以 导致 平均 数据 吞吐 率 的 减少 。 


SS. ASEEN ARATE T 时 间 3 







© eb ems BA Ne 时 间 内 没有 达到 其 工作 的 速度 ， Hee 


© “Get SMART for reliability,’ Paper TP-67D, July 1999, Seagate Technology, Scotts Valley, CA. 
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新 党 试 。 转 轴 重 试 次 数 用 来 记录 转轴 达到 规定 转速 所 用 的 次 数 。 这 个 参数 用 来 指示 转轴 
”电机 的 问题 或 电源 供电 的 问题 。 

ep gee err errr rer ers Te a 
FHP RA ALABMERB ARN RR, Bl, RRR HRA HSH 
区 (这 将 导致 数据 被 分 散 和 数据 传输 率 的 下 降 )。 驱 动 器 将 使 重 映射 (重新 分 配 ) HAE 
数量 保持 在 一 个 范围 内 ， 此 参数 值 的 增加 表明 可 能 存在 可 靠 性 的 问题 。 : 

寻 道 出 错 率 一 好 道 操 作 使 磁头 移动 至 所 需 的 磁道 。 如 果 寻 道 失败 ， 必须 再 次 尝试 。 
寻 道 通常 由 于 热 问题 (使 磁 辟 和 磁盘 膨胀 ) 导致 错误 ， 发 热 问题 可 能 是 由 于 定位 机 构 或 
者 磁盘 表面 受 损 而 引起 的 摩擦 导致 。 如 果 寻 道 出 错 率 增加 ， 失 效 的 可 能 性 也 会 增加 。 

st Nene emt bated FLAT MOH AOD. 
械 部 分 可 能 出 现 问题 。 

shed Kh odeen, 股 直 会 进行 自动 术 准 过 程 。 如 果 访 过程 
失败 ， 将 重复 该 过 程 ( 即 重新 校准 )。 如 果 重 新 校准 请 求 过 于 频繁 ， 很 可 能 是 由 了 机械 
障 或 电源 问题 (甚至 是 读 / 写 头 本 身 的 问题 )。 : 















Seagate 在 其 技术 报告 《 Get SMART for reliability 》( 编 号 TP-67D) 中 讨论 了 SMART 技术 
以 及 增强 技术 。 该 文 特别 指出 ， 存 在 疑似 问题 而 返回 Seagate 维修 的 驱动 器 中 有 40% 被 证 明 
是 好 的 。 这 些 驱 动 器 被 返回 是 因为 主机 系统 中 的 其 他 问题 (例如 ， 软 件 错误 或 病毒 的 影响 )。 

1999 年 ，Seagate 引入 了 了 驱动 器 自 测试 (drive-self test, DST) 技术 ， 它 为 预测 磁盘 失效 
提供 了 更 为 积极 主动 的 方法 。 它 在 驱动 器 的 固件 中 组 入 了 各 种 测试 。 例 如 ， 快 速 测试 (quick 
test) 花 2min 读 取 磁 盘 第 一 个 1.5GB 的 内 容 ; 扩展 测试 (extended test) 通过 完整 地 扫描 存 
储 介质 进行 更 彻底 的 检查 。 扩 展 SMART 技术 将 驱动 器 最 近 报 告 的 错误 记录 并 保存 下 来 。 该 
日 志 也 可 以 用 作 诊 断 。 

温度 对 磁盘 可 靠 性 的 影响 

电子 元 器 件 的 可 靠 性 高 度 依赖 于 温度 。 电 子 和 机 械 
部 件 (如 转轴 电机 和 传动 装置 轴承 ) 的 可 靠 性 都 会 随 温 
度 上 升 而 降低 。 磁 盘 驱动 器 在 高 温 下 长 时 间 工作 将 极 ， 靶 
大 地 降低 其 寿命 。 在 一 篇 有 意思 的 文章 《 IBM’s Drive xı phere 
Temperture Indocator Processor (Drive-TIP) helps ensure 
high drive reliability 》* 中 讨论 了 温度 和 磁盘 可 靠 性 之 间 ee 
的 关系 。 

图 3-31 显示 了 温度 与 系统 失效 率 之 间 的 关系 。 失 COT MSR 
效率 是 温度 的 指数 函数 ， 通 常 由 Arrhenius 公式 计算 : RAE =Aexp(—E/kT), Hp, A 和 五 
是 常量 ; k 是 Boltzman HA, T 是 绝对 温度 。 通 常 ， 温 度 每 升 高 1 办 磁盘 驱动 器 失效 率 增 加 
约 3%。 

高 温 可 以 导致 一 些 失效 。 例 如 ， 磁 盘 或 磁 辟 的 热膨胀 会 导致 数据 写 在 磁道 外 部 ， 从 而 使 
相 邻 磁道 的 数据 出 现 错误 。 较 高 的 温度 会 使 主轴 电机 和 音 圈 电 机 中 的 润滑 剂 因 汽化 而 泄漏 ， 
从 而 导致 磁头 阻塞 甚至 损坏 。 


© Cengage Learning 2014 


© Gary Herbst, “IBM’s Drive Temperture Indocator Processor (Drive-TIP) helps ensure high drive reliability,” IBM 
Storage System Division, 5600 Cottle Road, San Jose, CA, 1997. 
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热量 来 自 于 计算 机 中 的 芯片 和 磁盘 驱动 器 ， 散 热 需要 通过 风扇 或 自然 的 对 流 实现 。 风 扇 
失效 或 排 气 口 堵塞 会 使 温度 上 升 进而 导致 磁盘 失效 。IBM 在 其 某 些 磁盘 驱动 器 中 提供 了 温度 
检测 功能 以 进行 预警 。 这 些 驱 动 器 可 以 自动 监控 温度 ， 当 超过 其 最 大 允许 的 温度 时 向 驱动 器 
控制 器 报警 。 在 实践 中 ， 只 监控 两 种 温度 : 用 户 选择 的 最 低温 度 ， 以 及 驱动 器 构件 允许 的 最 
高 温度 .65%C 。 

” ”驱动 器 启动 后 就 开始 每 25min 读 取 一 次 温度 值 。 当 温度 超过 第 一 个 温度 值 (用 户 设 定 的 
最 低温 度 ) 时 ,采样 周期 从 25min 一 次 变 为 15min 一 次 。 此 时 ,在 永久 驱动 错误 目 志 中 会 记 
录 一 个 条 目 ， 包 括 温 度 和 已 通电 小 时 数 (power-on hours，POH)。 只 要 温度 高 于 第 一 个 温度 
值 ， 它 将 不 断 创建 日 志 条 目 。 如 果 温 度 超过 65% ,采样 周期 从 15min 一 次 变 为 10min 一 次 。 

IBM 的 驱动 器 温度 监控 可 以 与 其 开发 的 SMART 标准 一 起 监控 和 预测 设备 的 性 能 和 可 靠 
性 。 如 果 发 出 警告 ， 可 以 采取 保护 数据 的 一 些 措施 以 免 造成 难以 弥补 的 灾难 。 
摇晃 和 震动 

所 有 的 机 械 系统 对 物理 上 的 干扰 都 十 分 敏感 ， 如 振动 。 可 以 想象 ， 使 读 / 写 头 保持 


在 SOn (59.84.36 6 AE 100um 的 ] 的 太 首 中 类 并 以 7200rpm Hk AA 


十 分 不 易 的 。 磁 盘 驱 动 器 使 用 反馈 控制 将 磁头 保持 在 磁道 中 央 ; 也 就 是 说 ， 使 用 磁头 没 
有 正确 定位 这 个 误差 信号 来 移动 磁 辟 用 以 减 小 误差 。 

| ，，， 当 驱动 器 受到 外 部 振动 ， 磁 头 偏 移 当前 位 置 ， 将 产生 更 大 的 误差 信号 ， 利 用 该 信和 号 
可 以 使 磁头 返回 正确 的 位 置 。 不 幸 的 是 ,这 是 一 种 事后 (post hoc) 解决 方案 ; 在 打扰 发 
AZJI HATE, Hitachi 白皮书 ,人 ,Rotational Vibration Safeguard) 中 描述 了 一 种 用 于 
.减少 振动 产生 影响 的 新 技术 。 它 在 磁盘 驱动 器 的 电路 板 上 装 有 两 个 振动 传感器 (重力 传 
感 器 和 加 速度 计 ) 来 检测 运动 。 来 自 这 些 传感器 的 信号 将 控制 磁头 传动 装置 在 渐渐 偏离 
磁道 之 前 移 回 正确 的 位 置 。 在 实际 测试 中 ， 震动 将 使 磁盘 性 能 减少 到 原来 的 30% 左右 ， 
而 采用 转动 震动 保护 机 制 后 ， “应 用 的 性 能 提高 到 90%。 





3.4 安全 存储 和 RAID 系统 


在 20 世纪 70 年 代 和 80 年代， 硬盘 的 容量 比 现在 小 很 多 ， 每 兆 字 节 花 费 的 美元 也 比 现 
在 要 昂贵 得 多 。 个 人 电脑 革命 导致 了 中 小 尺寸 的 硬盘 成 本 快速 下 降 一 一 这 种 下 降 最 初 与 专业 
和 商业 计算 机 系统 中 的 大 型 设备 相应 的 价格 下 降 并 不 匹配 。 


失效 概率 

-假设 驱动 器 在 给 定时 间 内 的 失效 概率 为 In, WERZA p, EREN 100000h eae: 
“1 次 失效 ,pp 就 是 0.00001。 do RIL Bh SET PAm 个 驱动 器 ， 整 个 阵列 的 失效 概率 是 
BY? : 

“考虑 阵列 中 一 个 驱动 器 失效 ， Klee DS ERO HERS 单个 驱动 器 没 
”有 失效 的 概率 是 1-p。 由 于 失效 相互 独立 ， 两 个 驱动 器 都 没有 失效 的 概率 是 (1-p)(1 
P)o KH, m-1 个 驱动 器 都 没有 失效 的 概率 是 (1-p)”'。 此 时 ， 菜 个 驱动 器 失效 的 概率 是 
_P(1-p)”。 然 而 ， 由 于 光 个 驱动 器 中 的 任意 一 个 都 可 能 失效 ， 因 此 整个 阵列 中 只 有 一 个 
驱动 器 失效 的 概率 是 m:p:(1-p)”!。 ， 
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效 。 此 外 ， HFT m 个 驱动 器 中 任 选 两 个 ， 其 可 能 性 为 Cay 也 就 是 im- 
此 整个 阵列 中 有 两 个 驱动 器 失效 的 概率 是 cop" Lp 


二 人 A 





在 20 世纪 80 年 代 后 期 ， 研究 人 员 意 识 到 低 成 本 的 磁盘 驱动 器 可 按照 新 方法 使 用 。1987 
年 ，UC Berkely 的 Patterson, Gibson 和 Katz 发 表 了 一 篇 论文 《 A case for redundant arrays 
of inexpensive disks (RAID)》。， 提 出 了 一 种 在 PC 中 构成 廉价 磁盘 系统 的 方法 。 廉 价 磁盘 阵 
列 (array of inexpensive disk) 意味 着 使 用 当前 的 商用 磁盘 驱动 器 构成 了 一 种 结构 ， 而 宛 余 
(redundant) 意味 着 一 定 程度 的 容错 ; 也 就 是 说 ， 单 个 驱动 器 故障 不 会 使 整个 系统 失效 。 

RAID 的 概念 快速 从 研究 实验 室 中 传播 出 去 ， 到 20 世纪 90 年 代 中 期 ，RAID 系统 开始 
在 个 人 计算 机 杂志 上 打 广 告 。 今 天 ， 大 多 数 PC 机 主板 都 支持 RAID, Patterson 等 人 提出 了 
将 驱动 器 组 织 成 RAID 0、RAID 1 等 结构 的 方法 。 各 种 RAID 级 别提 供 不 同 的 功能 ， 某 些 强 
调 速度 ， 某 些 强调 可 靠 性 。 实 际 上 ， 并 非 所 有 的 RAID 今天 都 在 广泛 使 用 ， 有 些 混合 系统 实 
现 了 将 两 种 RAID 级 别 相 结合 的 特性 。 

磁盘 驱动 器 本 质 上 是 串 行 存 储 设 备 。 在 RAID 系统 中 ， 多 个 磁盘 驱动 器 可 以 并 行 操作 ， 
单个 文件 的 不 同 部 分 可 以 分 布 在 不 同 的 驱动 器 中 。RAID 阵列 可 以 用 来 提高 磁盘 系统 的 性 能 
(performance) 或 改善 可 靠 性 ( reliability)。 通 过 在 多 个 磁盘 中 复制 数据 ， 系 统 将 感受 不 到 单 
EERI RAID 系统 对 于 数据 安全 至 关 重 要 的 应 用 场合 (例如 银行 ) 是 十 分 重要 的 。 

个 磁盘 构成 驱动 器 的 可 靠 性 只 有 单个 磁盘 的 1/1n， 这 是 因为 n 个 磁盘 都 会 失效 。 同 样 ， 

1S AE KL eps pc IS 但 是 ， 飞 机 有 3 个 引擎 还 可 以 继续 飞行 ， 而 

单 引 擎 飞机 的 引 警 故障 将 是 灾难 性 的 。RAID 系统 的 作用 也 一 样 。 如 果 数 据 分 布 于 磁盘 阵列 

中 ， 单 个 磁盘 的 故障 不 会 导致 系统 崩溃 。 这 种 说 法 对 RAID 0 (0 级 RAID) 不 成 立 ， 它 只 是 
一 个 特例 。 

为 了 了 解 RAID ， 需 要 回忆 两 个 概念 。 首 先 ， 数 据 是 以 扇 区 (sector) 的 形式 记录 在 磁盘 
EW. B—, BPR ABA wR FF) (frame check sequence)， 可 以 检测 扁 区 中 的 一 个 或 
多 个 错误 。 这 种 检测 错误 的 能 力 意味 着 RAID 阵列 可 以 快速 发 现 单个 驱动 器 的 失效 。RAID 
技术 的 关键 概念 是 条 带 ( strip)。 整 个 磁盘 空间 分 为 若干 条 带 ， 它 可 以 是 一 个 扁 区 大 小 也 可 
以 是 几 兆 字 节 。 这 些 条 带 以 交叉 方式 分 布 在 多 个 磁盘 中 。 PENR TEAU P EM eee ely 
在 磁盘 中 的 分 布 方式 决定 了 RAID 的 级 别 。 

RAID 0 是 唯一 不 使 用 宛 余 来 提供 额外 安全 保障 的 级 别 。 具 及 n 个 驱动 器 的 RAID 0 将 
数据 划分 为 7 个 条 带 并 保存 在 1 个 驱动 器 中 。 图 3-32 展示 了 具有 4 个 驱动 器 的 RAID 0。 每 
个 磁 礁 驱动 器 的 天 小 相同 ， 否 则 RAID 阵列 的 有 效 容量 默认 以 容量 最 小 磁盘 的 大 小 计算 。 

RAID 0 阵列 的 优点 是 高 吞吐 量 。 个 驱动 器 的 容量 是 单个 驱动 器 的 二 倍 ， 由 于 读 操 作 
可 以 并 行 执行 因此 速度 较 高 = 丸和 A 卫 控制 器 可 以 通过 硬件 或 软件 来 实现 。 然 而 ， 正 如 前 面 所 
说 的 ， 常 见 的 RAID 控制 器 内 置 于 PC 的 主板 中 ， 用 户 可 以 做 的 只 是 插入 磁盘 驱动 器 和 配置 
BIOS, 


© D.A. Patterson, G. Gibson, and R. H. Katz, “A case for redundant arrays of inexpensive disks (RAID),” SIGMOD’88 
Proceedings of the 1988ACM SIGMOD International Conference on Management of Data, Volume 17 Issue 3, June 
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Disk 1 Disk2 Disk3 Disk4 
图 3-32 RAID 0 的 条 带 











BIOS - 
-PC 的 基本 输入 /输出 系统 (basic input/output system, BIOS). age Flash 存储 器 a, 
作为 加 电 时 的 引导 程序 。 BIOS 的 功能 是 从 硬盘 、 闪存 或 光盘 中 加 载 操作 系 统 。BIOS 也 
可 以 用 来 定义 系统 参数 ， 如 CPU 时 钟 频率 、 CPU 电压 以 及 DRAM 时 序 等 。 传 统 BIOS 
正在 消失 .， 逐 渐 被 统一 可 扩 展 固 件 接 口 ( unified extensible firmware interface, UEFI) 取 
Ro BIOS 变 为 UEFI 是 必要 的 ， 这 是 因为 BIOS 是 在 16 位 处 理 器 和 小 容量 磁盘 的 时 代 
设计 的 。UEFI 设计 用 来 支持 32 位 和 64 Cee ie ines 3TB se weet anid 2011 +, 
UEM 开始 出 现在 主流 主板 中 ， 





具有 个 驱动 器 的 RAID 0 阵列 的 容量 是 单个 驱动 器 容量 的 信 ， 也 就 是 说 ， 由 于 元 余 
并 没有 损失 容量 ， 存 储 效率 是 100%。 然 而 ， 由 于 没有 容错 ， 阵 列 中 任意 驱动 器 的 损坏 都 会 
导致 所 有 数据 失效 。RAID 0 的 读 写 性 能 很 出 色 。 

因为 一 个 磁盘 的 失效 会 导致 整个 系统 失效 ，RAID 0 阵列 只 有 在 经 常备 份 且 数 据 失 效 时 
可 以 从 备份 中 获取 时 才 有 意义 。 在 这 种 情况 下 ，RAID 0 内 在 的 并 行 读 写 机 制 使 其 在 磁盘 空 
间 利用 率 和 速度 上 都 是 高 效 的 。 

1. RAID 1 

图 3-33 展示 了 一 个 RAID 1 (1% RAID) 阵列 ， 由 于 它 将 条 带 的 副本 复制 到 多 个 驱动 
器 (这 里 使 用 两 个 驱动 器 并 行 操 作 ) 中 ， 因 此 也 被 称 为 镜像 ( mirroring)... 由 于 可 以 删除 一 
个 驱动 器 而 不 丢失 数据 ， 因 此 数据 的 安全 性 得 到 加 强 。RAID 1 系统 不 仅 增 加 了 数据 安全 性 ， 
它 还 提高 了 访问 性 能 。 假 设 需要 访问 给 定 的 条 带 , :在 访问 过 程 中 ， 系 统 将 可 以 从 提供 数据 的 
第 一 个 磁盘 中 读 取 该 条 带 。 

RAID 1 的 写 时 间 由 两 个 写 操 作 中 较 长 的 操作 决定 。 幸 运 的 是 ， 大 多 数 的 访问 为 读 操 作 ， 
而 不 是 写 操作 。 此 外 ， 可 以 缓存 写 操作 ， 人 允许 磁盘 在 空闲 的 时 候 完 成 写 操作 。RAID 1 阵列 
由 于 复制 了 数据 所 以 昂贵 ;但 它 可 以 通过 儿 百 美 
元 的 大 容量 高 速 磁盘 提供 性 价 比 较 高 的 安全 性 。 “I 1 控制 天 

由 两 个 磁盘 构成 的 RAID 1 系统 由 于 数据 是 简 最 简单 的 RAID 1 系 
单 复制 的 ， 所 以 效率 是 50%。 复制 提供 了 出 色 的 统 将 数据 镜像 ， 并 行 写 
容错 性 能 。 如 果 一 个 驱动 器 失效 ， 系 统 可 以 继续 rs 
正常 工作 。 所 要 做 的 是 去 除 失 效 的 驱动 器 ， 安 装 
一 个 新 的 ， 然 后 重建 丢失 的 数据 。 大 多 数 RAID 1 Disk1 Disk2 
控制 器 支持 对 失效 驱动 器 的 自动 重建 。 图 3-33 RAID1 
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称 为 RAID 0+1 BK RAID 0/1 的 混合 系统 通过 提供 快速 数据 访问 和 驱动 器 失效 保护 ， 结 
合 了 RAID 0 和 RAID 1 WERE. Al 3-34 显示 了 两 套 、3 个 驱动 器 构成 的 系统 。 条 带 写 在 驱 
动 器 1、2 和 3 中 ; 提供 RAID 0 的 服务 。 然 而 ， 驱动 器 1、2 和 3 镜像 为 4、5 和 6， 这 种 安 
排 提 供 了 RAID 1 系统 的 安全 性 。 这 样 的 安排 是 RAID 中 最 昂贵 的 形式 。 


RAID 0/1 





ete Rg 

两 个 镜像 的 £ 

Disk 1 Disk2 -Disk3 阵列， 每 个 阵 Disk4 Disk5 Disk 6 4 
列 均 使 用 条 带 S 

形式 © 


图 3-34 RAID 0/1 
2.RAID2 和 RAID 3 
RAID 2 到 RAID 6 都 像 RAID 0 那样 以 条 带 形式 存储 数据 ， 但 它们 并 不 像 RAID 1 那样 
完全 复制 数据 。 换 句 话 说 ，RAID 2 ~ RAID 6 介 于 两 种 极端 情况 RAID 0 级 (RATA) 和 
RAID 1 (复制 元 余 ) 之 间 。 






汉 明 码 RE 
e E 
多 个 宛 余 位 ， 每 一 位 都 需要 保护 数据 字 各 数据 位 的 奇偶 校 验 位 。 如 果 发 生 一 位 错误 ， 数 ， 
据 字 的 一 个 或 多 奇偶 校 验 位 将 不 再 正确 ， 可 以 用 它们 来 定位 错误 并 纠正 错误 。 站 

”现在 的 错误 检测 码 和 纠 错 码 远 比 汉 明 码 更 强大 ， 可 SESE OUR: AG 700 
明码 非常 容易 实现 ， 适合 可 能 只 有 一 个 磁盘 失效 的 环境 中 。 Saar 


RAID 2 和 RAID 3 采用 多 个 同步 的 磁盘 驱动 器 ; 也 就 是 说 ， 各 磁盘 转轴 同步 工作 ， 以 
便 读 / 写 磁头 同时 通过 阵列 中 的 每 一 块 磁盘 的 第 i 个 扇 区 。RAID 2 和 RAID 3 阵列 提供 真 
正 的 并 行 访问 ， 典 型 情况 是 ， 一 个 字 节 被 并 行 写 人 每 个 磁盘 。RAID 2 和 RAID 3 的 区 别 是 ， 
RAID 2 使 用 汉 明 码 来 进行 错误 检测 和 校正 ， 而 RAID 3 只 使 用 一 个 简单 的 校 验 位 来 检测 错 
Ro RAID 3 的 奇偶 校 验 数据 存储 在 一 个 磁盘 上 ;而 RAID 2 使 用 的 汉 明 码 可 能 分 布 在 多 个 
驱动 器 中 。 图 3-35 给 出 了 RAID 3 的 概念 图 ; 它 也 被 称 为 位 交叉 奇偶 校 验 (bit-interleaved 
parity ) 。 















校 验 驱 动 
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Disk2 Disk3 ||Disk 4 


数据 阵列 校 验 码 
Al 3-35 RAID 3 
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一 位 奇偶 校 验 码 通常 不 能 用 于 纠正 错误 。 但 它 可 以 在 RAID 3 阵列 中 纠 错 , 假设 一 个 磁 
盘 驱 动 器 失效 ， 因 此 在 失效 磁盘 上 记录 的 条 带 将 丢失 。 然而 ， 奇 偶 校 验 磁盘 上 记录 的 条 带 可 
以 用 来 重建 丢失 的 数据 。 表 3-3 给 出 了 具有 4 个 数据 磁盘 和 一 个 奇偶 校 验 磁盘 的 RAID 3 阵 
列 。 如 果 磁 盘 3 失败 ,会 出 现 表 3-4 的 情况 。 
表 3-3 RAID 3 阵列 


© Cengage Learning 2014 





© Cengage Learning 2014 


因为 知道 每 一 行 的 奇偶 校 验 位 ， 可 以 重新 计算 丢失 的 数据 。 例 如 ， 第 一 行 的 各 位 是 0、 
1、?、0 和 1。 由 于 校 验 位 是 奇数 ， 因 此 数据 位 中 必须 有 奇数 个 1。 因 此 ， 丢 失 的 位 必然 为 0。 

3.RAID 4 和 RAID 5 

RAID 4 #il RAID 5 与 RAID 2 和 RAID 3 相似 。 然 而 , RAID 4 和 RAID 5 中 ,单个 磁盘 
不 再 同步 而 是 彼此 独立 地 操作 。 其 条 带 远 比 RAID 2 AI RAID 3 的 要 大 。RAID 4 ( 块 交 又 奇 
偶 校 验 ，block interleaved parity) 中 ， 奇 偶 校 验 条 带 被 存储 在 一 个 磁盘 上 ， 而 在 RAID 5 中 ， 
奇偶 校 验 条 带 被 交错 存储 在 阵列 中 的 所 有 磁盘 上 。 当 更 改 数据 时 可 以 通过 修改 相应 的 奇偶 校 
验 位 来 高 效 地 更 新 RAID 5 中 的 奇偶 校 验 信 息 。 

图 3-36 所 示 的 RAID 5 是 一 种 流行 的 配置 ， 提 供 了 条 带 存储 以 及 错误 恢复 所 需 的 奇偶 校 
验 。 奇 偶 校 验 块 分 布 在 阵列 中 的 各 个 驱动 器 中 ,使 访问 负载 在 驱动 器 中 更 加 平衡 。RAID 5 
阵列 至 少 需 要 3 个 驱动 器 。 







RAID 5 控制 器 






ECC1 是 磁盘 
2 至 4 的 纠 错 码 


Disk 1 Disk2 » Disk3 
图 3-36 RAIDS 


由 于 需要 时 间 来 维护 奇偶 校 验 信息 ，RAID 5 系统 的 写 性 能 被 降低 ， 所 以 如 果 需 要 最 高 
的 性 能 ，RAID 5 不 是 理想 的 选择 。 
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4. RAID 5 失效 的 例子 

Permabit Technology 公司 在 其 白皮书 9 中 提供 了 一 个 有 关 RAID 失效 成 本 的 有 趣 例 子 。 
他 们 考虑 的 RAID 5 系统 由 500GB AY SATA 驱动 器 构成 ,驱动 器 的 平均 无 故障 间隔 时 间 
(Mean Time Between Failure, MTBF) 为 1000 000h, 位 错误 概率 为 /10* 位 或 者 1/12.5TB。 
这 意味 着 读 失 效 大 约 每 12.5TB 发 生 一 次 。 

假设 RAID 5 阵列 有 7 个 数据 磁盘 和 一 个 奇偶 校 验 磁盘 。 有 用 的 数据 容量 为 7 x 500GB= 
3.5TB。8 个 驱动 器 的 MTBF 为 125000h (单个 驱动 器 MTBF 的 1/8 )。 在 正常 操作 中 ， 无 法 
纠正 的 读 操 作 可 能 会 出 现 ， 但 可 以 通过 :RAID 机 制 纠正 。 

假设 8 个 驱动 器 中 某 一 个 失效 。 因 为 RAID 5 的 属性 ， 其 余 .7 个 磁盘 将 继续 以 降级 模式 
运行 ， 直 到 失效 的 驱动 器 被 替换 、 数 据 被 重 构 。 现 在 辟 梦 开始 了 。 为 了 完成 数据 重 构 ， 包 含 
3.5TB 数据 的 7 个 工作 驱动 器 必须 被 完整 地 读 取 。 由 于 位 错误 概率 为 1/12.5TB, A 28% 的 
可 能 在 重建 过 程 中 发 生 无 法 纠正 的 错误 而 导致 数据 丢失 。 换 句 话 说 ， 由 于 单个 驱动 器 失效 
而 重 构 所 需 巨 量 数据 ,缺乏 进一步 的 元 余 意 味 着 几乎 有 28% 的 可 能 是 所 有 数据 都 无 法 恢复 。 
显然 ，RAID 并 不 能 完全 防止 错误 。 

5. RAID 6 

RAID 6 是 RAID 5 的 扩展 ， 其 组 织 除了 一 个 变化 外 与 图 3-36 基本 相同 。 它 也 像 RAID 
5 阵列 那样 存储 纠 错 信息 ， 而 且 每 个 驱动 器 中 存储 了 第 二 个 校 验 块 。RAID 6 与 RAID 5 的 特 
性 类 似 。 然 而 ,额外 的 奇偶 校 验 信 息 使 其 在 一 个 驱动 器 失效 后 的 重建 过 程 中 可 以 纠正 错误 。 


RAID 阵列 对 失效 的 处 理 、 an aes 
” 当 RAID 阵列 中 一 个 硬盘 失效 时 ， Re ee he ee 
切换 (hot swappable) 的 ; Lm ela 可 以 在 不 关闭 电源 和 重启 的 情况 下 取出 失效 的 驱 、 
动 器 并 播 入 一 个 新 的 进行 荐 。 更换 驱动 器 后 ， 新 的 驱动 器 必须 为 阵列 进行 配置 。 在 
ee ARIA EA (x Grebollding): le at a 





AA RAID 的 特性 < 









二 RAID 级 别 bs 
RAIDO 最 快 和 最 有 效 的 安排 。 不 提供 容错 机 制 。 需 要 至 少 两 个 驱动 器 全 
_ RAID! 数据 镜像 (复制 )。 性 能 侯 关 、 容 错 环境 下 的 最 好 选择 。 需 要 至 少 两 个 驱动 器 1 


_ RAID2 446 FRA ZK ECC 机 制 的 驱动 器 不 使 用 这 种 模式 
这 种 模式 可 以 用 来 加 快 数据 传输 ， 并 通过 增加 一 ere 
来 提供 容错 功能 。 因 为 这 种 模式 需要 转轴 同步 的 驱动 器 ， 今 天 已 经 很 少 使 用 。 至 少 需 要 3 个 磁盘 
T RAID4 很 少 使 用 
hans 这 种 模式 结合 了 高 效 、 容 错 和 高 性 能 的 数据 存储 。 然 而 ， 驱 动 器 失效 后 的 性 能 很 差 ， 由 于 重建 入 3 
d 奇偶 校 验 信息 需要 较 长 时 间 导致 重建 过 程 缓慢 。 需 要 至 少 3 个 驱动 器 g 
- RAID 0+1 对 整个 RAID 0 按照 RAID 1 进行 镜像 ， 需 要 4 个 或 更 多 的 磁盘 。 提 供 容错 和 改进 的 性 能 seh 
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RAID 级 别 
E 对 每 个 磁盘 先 按 照 RAID 1 进行 镜像 ， 然 后 再 构成 RAID 0。 与 RAID 0+1 类 似 ， 但 性 能 更 好 
对 整个 RAIDS5 按照 RAID 1 进行 镜像 。 至 少 需要 3 个 磁盘 


: rsk eee : : 人 
e (just i N Ob > JBOD 不 是 
RAND 过， 祖坟 (让) ODIELIG SN 
ere ae 
“ ”JBOD 技术 的 优点 是 ， 刀 1 aie hie ARAN Bo 
IBOD 并 不 提高 性 能 也 不 提高 可 靠 性 。 


3:9 固态 盘 


通过 前 面 的 介绍 可 见 ， 机 电磁 盘 驱 动 器 是 技术 的 奇迹 ，3.5 英寸 形状 的 磁盘 容量 可 以 达 
到 4TB。 然而 ， 它 的 生存 空间 受到 引入 国 态 盘 solid-state drive, SSD) 的 限制 。SSD 可 以 
用 来 模拟 硬盘 。 固 态 硬 盘 使 用 半导体 闪存 技术 来 存储 数据 ;其 电子 接口 与 硬盘 接口 物理 上 
兼容 ;也 就 是 说 ， 可 以 将 SSD 插入 硬盘 的 SATA 插座 。 串 行 高 级 技术 附件 (Serial Advanced 
Technology Attachment, SATA) 是 从 磁盘 驱动 器 到 主机 控制 器 的 一 种 低 成 本 、 高 速 串 行 存储 
设备 接口 。 










可 有 有 大和。 人 加， 加 启示 人 
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相 比 机 电磁 盘 ， SSD ey ar EARNER. 重量 
更 轻 ， 以 及 更 能 容忍 震动 。2010 年 ，SSD 开始 在 高 端 笔记 本 电脑 (2.5 英寸 ) 和 专业 高 端 应 
用 (3.5 英寸) 中 初 见 端倪 。2012 4F, SSD 成 为 高 级 笔记 本 电脑 的 标 配 。SSD 的 局 限 性 是 双 
HN: 它们 的 成 本 相对 较 高 且 容 量 相 对 较 小 。 

-固态 盘 由 前 面 章 节 中 介绍 的 闪存 技术 构成 ; 正 是 由 于 近年 来 闪存 的 价格 降低 到 一 定 程 
E, 才 使 得 大 容量 (128GB) 固态 盘 在 经 济 上 成 为 可 能 之 选 。 

由 于 固态 盘 没 有 移动 部 件 ， 它 们 是 真正 的 随机 访问 设备 。 固 态 盘 没有 旋转 延迟 时 间 和 寻 
道 时 间 。 因 此 ， 与 硬盘 碎片 有 关 的 问题 自然 就 消失 了 。 当 文 件 分 布 于 整个 存储 空间 时 ， 不 需 
要 定期 地 整理 SSD。 早 在 2007 年， 一 份 来 自 IDC9 的 白皮书 指明 了 基于 SSD 的 笔记 本 潜在 
的 收益 。 


© J. Janukowicz and D: Reinsel, “Evaluating the SSD total cost of ownership,” IDC, Novermber 2007. 
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e PC 部署 的 I 劳动 力 收益 “一 ”2.4% 


“。 外 包 维修 的 可 靠 性 收益 ““ E i | 1.4% 
o 维修 的 可 靠 性 收益 : EERS% 
° ee ee = ns 17.2% 
o 能 力 增强 收益 eas z an Se 16.9% 
e 


用 户 生产 力 收益 二 ee S45% 





当然 ， 这 些 数字 适用 于 特定 的 企业 环境 ， 在 特定 的 时 刻 ， 并 且 基 于 许多 假设 。 然 而 ,其 
原理 是 有 效 的 。 闻 态 盘 取代 宣 盘 会 带 来 利益 ， 而 获取 的 利益 会 导致 新 一 代 固态 盘 的 发 展 。。 

固态 盘 的 特点 

标题 中 “特点 (feature)” 这 个 词 颇 有 讽刺 意味 ， 类 似 那 句 话 “这 是 一 个 特点 ， 而 不 是 
污点 "。 磁 盘 的 读 、 写 和 擦 除 都 要 花费 时 间 。 当然 ， 这 是 必需 的 ,因为 磁盘 表面 在 读 / 写 头 
下 方 通过 ,可 以 读 取 或 写 人 的 时 间 是 固定 的 ， 且 由 系统 的 机 械 部 分 决定 。 固态 存储 器 使 用 不 
同 的 读 和 写 机制 。 例 如 ， 读 取 内 存单 元 ， 需 要 向 硅 通 道 注 人 电流 ,然后 检测 浮 机 上 存储 的 电 
荷 是 否 允许 电流 通过 。 向 位 元 中 写 数据 时 ， 需 要 向 浮 栅 上 注 和 电荷 。 该 过 程 可 能 需要 多 个 步 
又 ， 因 为 有 些 系统 分 几 步 注入 电荷 并 测试 数据 是 否 被 存储 (在 存储 足够 的 电荷 前 可 能 需要 执 
行 多 次 写 )。 清 除 位 元 的 过 程 更 为 复杂 ， a oe tae | 








日 固态 硬盘 也 有 负面 影响 。 比如 如 果 一 个 小 丛 间 入 会 议 厅 ， 正好 代表 们 出 去 吃 午 饭 ， 留 下 了 他 们 的 笔记 本 电 
脑 ， 小 偷 可 能 会 带 着 有 ,SSD 的 笔记 本 逃跑 。 
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由 于 不 同 的 读 、 写 和 擦 除 机 制 ，SSD 的 读 写 时 间 不 相等 。 一 般 来 说 ，SSD 的 读 取 时 间 
比 写 时 间 要 快 很 多 。 图 3-37 展示 了 几 种 SSD 在 随机 读 或 写 2MB 数据 时 的 性 能 。 水 平 长 度 
表示 数据 传输 率 ， 单 位 为 MB/s。 注 意 SSD 不 同 模型 之 间 的 显著 区 别 9。 


Pa 









He 


BS 
由 4K 个 块 组 成 的 2MB 数据 的 随机 传输 





300 400 500 


From Storage Review, http://www.storagereview.com/intel_ssd_510_review_250gb 


MB/s 
图 3-37 SSD 2MB 随机 传输 (4K HE) 


来 自 storagereview.com 的 图 3-38 给 出 了 几 种 固态 盘 的 顺序 数据 传输 性 能 。 这 些 数字 表 
示 对 2MB 数据 进行 顺序 和 随机 的 读 取 和 写 人 操作 。 注 意 SSD 几 种 不 同 模型 之 间 的 区 别 。 还 
要 注意 写 性 能 可 能 只 有 读 性 能 的 50%。 
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a) 2MB 数据 块 的 顺序 传输 率 ( 读 / 写 ) 
图 3-38 SSD 随机 读 和 写 


© Oliver B., “Comparison of 32GB SSD vs 10,000 RPM HDs”, http://www.xIr8yourmac.com/. 
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SSD 的 第 二 个 特征 是 写 周 期 数量 的 限制 。 当 闪存 存储 位 元 被 擦 除 ， 环 绕 栅 极 的 介 电 绝 
缘 体 被 破坏 ， 存 储 位 元 在 一 定数 量 的 周期 后 将 失效 。 此 外 ,重复 的 写 周 期 可 以 导致 电荷 捕获 
效应 (charge trapping)， 从 而 导致 存储 位 元 停留 在 零 状态 。 当 闪存 用 于 BIOS、 数 码 相机 或 
MP3 播放 器 的 存储 器 时 ， 闪 存 的 耐久 性 不 大 可 能 成 为 问题 ， 因 为 可 忍受 的 典型 最 小 擦 除 周 
期 为 10000 ~ 100000 次 的 量 级 。 然 而 , , 当 闪 存 作为 三 级 存储 器 时 ， 效 果 就 不 一 样 了 。 

一 种 称 为 损耗 均衡 ( wear leveling) 9 的 技术 通过 将 负载 分 散在 整个 设备 中 以 克服 闪存 写 
周期 限制 产生 的 不 利 影响 。 它 使 用 一 种 内 存 管理 形式 将 驱动 器 控制 器 请 求 的 块 地 址 映射 到 存 
储 器 阵列 中 的 物理 块 地 址 。 控 制 器 跟踪 物理 存储 器 中 块 被 使 用 的 频 度 ， 改 变 映射 表 确 保 所 有 
物理 块 中 的 负载 均衡 。 

Micron 的 技术 报告 TN-29-42 提供 了 损耗 均衡 的 一 个 示例 。 假 设 某 系统 不 使 用 损耗 均衡 
技术 ，50 个 数据 块 一 小 时 更 新 6 次 。 此 外 ,. 假设 这 50 个 块 可 以 使 用 存储 器 空间 中 的 200 个 
块 。 由 于 每 一 个 块 可 以 使 用 设备 中 4 个 块 中 的 一 个 ( 即 200/50 )， 因 此 其 生存 周期 是 10000 
周期 x 4=40000 周期 。 在 更 新 速度 为 6 个 文件 /bh 的 情况 下 ， 存 储 器 的 生存 周期 大 约 是 280 
天 。 然 而 ， 如 果 使 用 损耗 均衡 ， 存 储 器 中 所 有 4096 块 均 可 用 ,生存 周期 将 扩大 4096/200 
fi, AWS 年 。 

有 很 多 方法 实现 损耗 均衡 。 例 如 ， 可 以 将 存储 空间 划分 为 静态 和 动态 区 域 。 静 态 区 域 用 
于 存储 相对 不 太 可 能 被 改变 的 数据 (例如 ， 程 序 )。 管 理 静 态 数据 不 需要 损耗 均衡 。 动 态 区 
域 用 于 存储 经 常 被 改变 的 数据 ， 并 由 损耗 均衡 软件 来 管理 

Toshiba 发 布 的 信息 表 8 得 到 了 有 意思 的 结论 ,，128GB 的 Toshiba ML.C SSD 五 年 中 估计 
的 访问 量 可 达到 80TB。 该 磁盘 使 用 NAND 闪存 技术 和 多 层次 数据 存储 技术 (每 个 位 元 存储 
多 于 一 位 的 数据 ), 与 其 他 技术 相 比 支持 更 少 的 写 周期 。 如 Toshiba 所 述 ， 这 相当 于 每 天 超 
过 20GB 的 数据 ， 这 对 于 大 多 数 移动 电脑 的 终端 用 户 应 用 程序 来 说 都 是 巨大 的 数据 量 。 如 果 
SSD 更 大 ， 可 以 改写 的 数据 量 也 相应 地 增长 。 注 意 ; 基于 SLC 技术 的 512GB SSD 每 日 可 以 
支持 2TB 的 数据 访问 量 。 


© “Wear-leveling techniques in NANO flash devices”, Micron Technical Note TN-29-42. 
© “Solid State Drives: Separate myths from facts,” Toshiba America Electronic Components, Inc., V1 3, June 2009. 
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Intel 优化 器 






R a A ar 
使 用 。 从 Windows 和 硬盘 驱动 器 角度 看 文件 系统 没有 区 别 ， ‘42% SSD 对 空闲 空间 的 处 
理 与 Windows 的 处 理 方式 是 不 同 的 。 这 种 差异 是 由 于 以 下 原因 造成 的 : SSD 区 分 已 经 被 
控 除 ， 可 以 写 入 数据 的 空闲 空间 ， 以 及 包含 不 需要 的 数据 、 但 是 尚 不 可 以 写 入 的 空闲 空 
间 。 因 为 优化 器 通过 擦 除数 据 回收 空闲 空间 并 使 其 可 以 被 使 用 ， 系 统 性 能 得 到 了 改进 。 

| 注意 ， 优 化 器 并 不 从 回收 站 中 删除 文件 ， 这 将 使 用 户 不 能 恢复 意外 删除 的 文件 。 回 

| 收 站 中 的 文件 将 一 直 保留 ， 直 到 用 户 执 行 清空 回收 站 FRR recycle bin) 命令 一 此 时 
.优化 器 将 回收 文件 占用 的 空间 。 





混合 驱动 器 se = : : - ; 
到 2010 年 ， SSD 逐渐 在 高 端 应 用 场合 中 出 现 ， ee or eG 
RHMERS MS SAKSRECAHOARH SAR RMR in 

tus XT 将 这 两 种 技术 结合 在 二 起 ， 提 供 具 有 4GB 闪存 (加 上 





大 容量 的 32MB 的 快速 半导体 缓存 ) 的 500GB 磁盘 。4GB 的 闪存 相对 总 容量 来 说 较 小 ， 
但 板 载 软件 监控 磁盘 的 使 用 情况 并 缓存 经 常 使 用 的 数据 。 性 能 数据 表明 ， 混 合 驱 动 器 相 
比 传统 的 硬盘 驱动 器 有 较 好 的 性 能 优势 。 其 他 测试 已 经 表明 ， 混合 驱动 器 的 启动 时 间 
(加 载 Windows) 相 比 传统 的 硬盘 驱动 器 有 25% 的 改善 ， 且 在 关机 时 性 能 提高 F 300%. 
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磁带 提供 了 存储 海量 数据 的 手段 。: 在 数据 每 年 增长 约 60% 的 情况 下 ， 档 案 存 储 就 是 至 
关 重 要 的 。 在 20 世纪 60 年代 和 70 年 代 的 科幻 电影 中 是 不 可 能 错过 磁带 驱动 器 的 。 机房 中 
摆 满 磁带 柜 ， 一 大 盘 磁 带 在 其 中 旋转 ， 然 后 停止 不 动 ， 接 着 再 次 启动 甚至 反 转 。 在 那 时 候 ， 
首选 的 备份 媒介 为 磁带 ,因为 它 相对 便宜 、 可 以 存储 大 量 的 数据 。 

数据 以 多 条 平行 磁道 的 形式 存储 在 磁带 上 (通常 为 9 条 ; 分 别 记 录 8 个 数据 位 和 工 个 奇 
偶 校 验 位 )。 磁 带 记录 技术 几乎 与 磁盘 技术 相同 ,区 别 在 于 沿 着 柔软 的 磁带 (通常 为 2400 英 
RE) 上 有 一 条 9 位 宽 的 轨迹 。 磁 带 驱动 器 需要 强大 的 引擎 来 快速 旋转 和 停止 磁带 盘 。 直 到 
20 世纪 80 年 代 ， 磁 带 盘 的 直径 为 10.5 英寸 ,典型 的 数据 存储 密度 通常 为 128 个 字符 /in。 
当然 ， 所 有 磁带 系统 的 延迟 都 很 长 ， 因 为 定位 所 需 数据 需要 将 磁带 在 读 / 写 头 下 方 移动 这 
可 能 需要 几 秒 甚至 几 分 钟 。 因 此 ， 磁带 完 全 是 一 种 保存 档案 的 介质 。 

磁带 驱动 器 越 来 越 小 ， 磁 带 盒 技 术 〈 类 似 音频 磁带 和 VCR 磁带 ) 也 在 发 展 。 为 了 在 磁 
带 上 存储 更 多 的 数据 ， 通 过 使 用 旋转 的 螺旋 读 / 写 头 ， 信 息 沿 着 斜 线 存 储 在 磁带 上 。 同 样 的 
写 机 制 被 用 于 美国 的 VCR。1972 年 引入 的 1/4 英寸 磁带 机 (QIC) 标准 为 开盘 式 录制 设备 
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带 来 了 大 发 展 ,支持 30 条 磁道 、 线 性 记录 密度 为 51Kb/in、 带 速 为 120in/s 的 1.35GB 磁带 。 
到 2010 年 ,1/4 寸 磁 带 机 基本 都 过 时 了 。 今天 ， 在 磁带 上 广泛 使 用 线性 蛇 形 (serpentine) 记 
录 技术 进行 数据 存储 。 术 语 蛇 形 意味 着 记录 具有 锯齿 形 特 性 ， 磁带 上 的 一 些 轨 迹 记 录 从 左 到 
在 ， 另 二 些 轨迹 记录 从 右 到 左 。 因此 ， 当 磁道 到 达 终 点 时 ， 它 不 需要 回 退 ;只 要 改变 方向 就 
可 以 继续 读 或 写 数据 。 
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的 观点 。2011 年 1 月 ，HP 公司 报道 ， 其 LTO 磁带 驱动 需 的 全 球 市 场 在 2008 年 年 未 至 2009 
年 年 末 下 降 了 约 30%， 但 到 2010 年 年 底 (相对 2008 年 的 数据 ) 增加 了 45%。 这 相当 于 磁 
带 使 用 的 复兴 。 此 外 ,磁带 具有 比 磁盘 驱动 器 更 低 的 总 体 拥 有 成 本 (total cost of ownership, 
TCO)。 大 型 组 织 ， 如 执法 或 医疗 机 构 ， 有 大 量 数据 需要 存储 。 总 体 拥有 成 本 包括 设备 、 介 
质 、 占 地 面积 、 维 修 以 及 能 耗 。 针 对 大 型 组 织 12 年 期 间 的 数据 ， 基 于 磁盘 存储 的 TCO 可 能 
是 基于 磁带 存储 的 TCO 的 15 倍 ? 。 

直到 20 世纪 90 年代 未 ，LTO (Linear tape-open) 标准 才 被 提出 。open 这 个 词 表 明 该 标 
准 是 开放 的 ;不 像 早 些 时 候 由 BMA HP 提出 的 专 有 标准 a LTO 的 第 一 个 标准 一 一 LTO:1， 
导致 了 100GB 的 盒 式 磁 带 的 出 现 。 到 2010 年 ， 已 经 发 布 了 ETO-6 标 准 ; 它 支持 1.5TB 的 
容量 ， 使 用 896 个 磁道 ， 线 性 密度 为 15142b/mm， 数 据 传 输 率 为 140MB/ss。 LTO 标准 已 经 
扩展 到 LTO-8 版 本 , 支持 12.8TB HARR, 该 标准 尚未 公布 。LTO-5 标准 的 1.5TB AI 
磁带 并 不 便宜 和 201H 4F, 盒 式 磁带 费用 是 50 美元 的 量 级 ; 这 与 硬盘 存储 器 类 似 。 

制造 现代 高 密度 磁带 并 不 容易 。 轨道 之 间 的 距离 很 小 使 得 磁带 方向 稳定 性 (tape 
dimensional stability) 成 为 一 个 问题 。 磁 带 在 温度 和 湿度 的 影响 下 可 以 改变 尺寸 。 这 意味 着 ， 
在 写 数据 时 与 并 行 磁头 排列 一 致 的 磁道 与 稍 后 读 取 磁带 时 的 磁头 排列 可 能 不 二 致 。 这 导致 需 
要 高 度 稳定 的 带 基 板 。 例 如 ,二 些 制造 商 使 用 聚 酰胺 ， 它 是 凯 夫 拉 芳 纶 纤维 材料 的 近亲 。 该 
材料 的 一 个 额外 的 好 处 是 ， 如 果 遭 受 攻击 ， 可 以 用 它 织 成 防弹 背心 

LTO 盒 式 磁带 的 过 个 有 趣 选 项 是 一 次 读 多 次 写 (write once read many, WORM) 模式 ， 
人 允许 盒 式 磁带 只 能 写 人 一 次 。 底 层 的 记录 介质 与 盒 式 磁带 相同 ， 但 物理 接口 可 以 防止 重 写 ， 
它 具 有 一 个 不 同 的 伺服 磁道 来 校 验 数据 没有 被 修改 过 。 这 些 盒 式 磁带 存储 的 数据 需要 防止 算 
改 是 因为 其 法 律 用 途 而 不 允许 修改 。 

对 于 数据 存储 来 说 ， 磁 带 仍然 是 有 吸引 力 的 存档 机 制 ， 因 为 它 可 拆 印 也 可 移动 。 下 一 
节 将 介绍 的 光学 存储 介质 也 是 可 拆卸 和 可 移动 的 ， 但 尚未 提供 多 个 TB 的 数据 存储 能 力 。 直 
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到 20 世纪 :90 年 代 初 ， 磁 带 都 使 用 氧化 介质 和 铁 氧 体 读 / 写 头 。 在 过 去 的 .20 年 里 ， 磁 头 技 
术 的 进步 (与 硬盘 驱动 器 磁头 的 进步 相同 ) 大 大 改善 的 磁性 介质 ， 磁 道 密度 的 增加 ， 使 得 
磁带 系统 的 面 密度 增加 了 超过 3 个 数量 级 。 例 如 ;，Sony 公司 开发 的 磁 粒 子 技术 通过 将 30nm 
的 金属 粒子 封装 在 合金 /陶瓷 涂 层 中 以 防止 氧化 和 渐进 的 数据 丢失 来 提供 高 密度 记录 。。 同 
样 ， 为 了 减少 退 磁 效应 需要 非常 薄 的 磁 层 。 当 前 磁 层 约 为 200nm 的 量 级 (人 类 头发 的 直径 
为 60000nm ) 。 
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3.7 ”光学 存储 技术 

利用 物质 磁性 来 存储 数字 信息 一 点 也 不 奇怪 ， 这 是 因为 磁性 固有 的 二 值 属性 ， 它 已 经 在 
相当 长 的 一 段 时 间 里 被 应 用 于 各 种 系统 中 。 基 于 光 来 实现 数字 存储 记录 机 制 的 应 用 早已 是 
见怪 不 怪 。 照 相 底 片 已 用 于 存储 模拟 图 像 许 多 年 了 。1834 年 ，Henry Fox Talbot 使 用 浸润 所 
化 银 后 的 相 纸 制 成 永久 的 负面 图 像 (底片 ) 。 正 面 图 像 是 将 负面 图 像 通过 接触 印 吊 (contact 
printing) 到 另外 一 张 感光 纸 上 。 

传统 化 学 照相 技术 确实 可 以 用 来 存储 数字 数据 。 假设 有 一 张 2in x 2in 覆盖 着 感光 材料 的 
塑料 。 可 以 使 用 与 激光 打印 机 相同 的 技术 在 其 上 存储 《和 例如 2x1200x2x1200 个 点 站 和 使 
用 数据 ， 并 使 用 文档 扫描 仪 技 术 来 读 取 数 据 。 这 种 技术 可 提供 约 720000 字 节 / 页 的 存储 容 
量 ， 甚 至 可 以 将 速度 提高 .10 倍 达 到 7.2MB/ 页 的 容量 。 

光学 数字 存储 介质 曾经 是 蓄 势 待 发 而 且 是 不 可 避免 的 一 项 发 明 。 问 题 只 是 看 哪 种 技术 将 
占 主导 地 位 ， 哪 些 公司 将 抢先 占领 市 场 。 本 章 将 介绍 3 种 数字 计算 机 所 使 用 的 光 记 录 机 制 : 
CD, DVD 和 蓝光 光盘 。 因 为 使 用 相同 的 底层 技术 , 这 里 将 依次 介绍 它们 。 它 们 之 间 的 差异 
主要 就 是 规模 ; 随 着 时 间 的 发 展 ， 可 以 将 这 些 特性 按 比例 缩小 至 存储 数据 的 盘 片 上 。 


3.7.1 .数字 音频 


光 存 储 的 出 现 比 许多 人 认为 的 要 早 许多 。Philips 在 20 世纪 70 年 代 早 期 就 开发 并 在 80 
年 代 推 出 了 激光 影碟 。 激 光影 碟 具 有 与 现今 CD (compact disk) 相同 的 特性 ; 只 是 激光 影碟 
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使 用 模拟 技术 。 激光 影碟 系统 是 只 读 的 ;很 少 有 电影 存储 在 其 上 。 激光 影碟 的 费 效 比 不 高 且 
不 够 成 熟 ， 因 此 是 一 种 失败 的 技术 。 

人 们 所 熟知 的 数字 音频 很 大 程度 二 要 归功 手 两 大 消费 电子 行业 巨人 之 间 的 合作 。20 t 
纪 70 年 代 ，Philips 和 Sony 联手 开发 了 光 存 储 技术 ;特别 受益 于 Philips 各 才 生效 术 记 的 兴 
富 经 验 和 Sony 在 编码 和 纠 错 机 制 方面 的 专业 知识 。 

Philips 和 Sony 的 一 个 重要 成 就 是 基本 记录 和 回放 机 制 的 标准 化 。 因 为 技术 和 各 种 
参数 的 复杂 性 ， 这 种 标准 化 绝 非 易 事 。 两 个 基本 参数 是 CD: 尺 寸 和 采样 频率 (sampling 
frequency)5' 盘 片 的 直径 是 12cm， 采 样 频率 选择 为 44.1kHz。 虽 然 这 似乎 是 一 个 奇怪 的 数据 ， 
但 这 是 高 质量 音频 所 需 的 采样 频率 ,电视 系统 也 使 用 相同 频率 。 据 报道 ，CD 的 基本 参数 必 
须 兼 顾 74min 的 音乐 时 长 ， 这 足以 在 单 张 CD LAWNS - 卡拉 扬 版 的 贝多 芬 第 蕊 交响 曲 。 另 
二 方面 ,参与 CD 研发 的 一 些 人 否认 了 这 个 故事 的 真实 性 。 不 管 怎样 ,希望 它 是 真 的 。 

第 一 个 基于 光 的 实用 、 低 成 本 、 高 密度 光 存储 机 制 是 CD， 它 在 1981 年 推出 ;* 用 来 以 数 
字 的 方式 存储 高 质量 的 声音 。 在 引入 CD 之 前 ,音乐 存储 在 磁带 或 黑色 乙烯 密 绞 唱片 (Long 
Playing record, LP) 上 。 LP 又 大 又 重 ,， 每 面 只 能 保存 25min 的 音乐 ;此 外 ， 它 是 模拟 介质 并 
非常 容易 损坏 (例如 ， 刘 痕 和 扭曲 )8 | ' 

CD 的 结构 类 似 于 磁盘 ， 它 沿 着 某 条 轨迹 存储 信息 。 与 硬盘 不 
E, CD 的 轨迹 是 连续 的 螺旋 轨迹 ， 如 图 3-39 所 示 。 螺旋 轨迹 约 
20000 圈 ， 约 相当 于 3 英里。 有 效 的 道 密度 为 16000 Æ An, MER 
的 最 大 面 密度 是 1Mb/mm? 或 80Mb/in?。 

CD 上 的 数字 信息 印 制 在 1.2mm 的 塑料 盘 片 表面 ， 由 称 为 四 过 
(pit) 的 缺口 的 组 合 形 式 记录 成 不 同 的 长 度 。 媚 坑 具有 反光 层 和 保护 
Bo 表面 没有 缺口 的 地 方 被 称 为 平面 (1and)s 扒 片 中 央 孔 的 直径 为 “1 “图 3-39 螺旋 轨道 ， 
15mm， 数 据 记 录 在 离 中 心 25 ~ 58mm WAH ES 

读 取 数 据 的 过 程 是 首先 在 盘面 上 照射 形成 一 个 微小 的 点 ,然后 检测 从 表面 反射 回 的 光线 
强度 。 每 当 激 光 点 从 止 坑 移 动 到 平面 七 时 反射 光 强 就 会 发 生变 化 ,反之 亦 然 。 

图 3-40 说 明了 -CD 表面 的 结构 。 创造 上 四 坑 这 个 词 在 词法 上 受到 挑战 .四 坑 从 盘 片 表面 
长 出 ;民间 说 法 叫 帮 肿 块 (bump)。 媚 坑 一 词 指 的 是 从 盘 片 上 部 的 标签 层 向 数据 记录 层 看 去 
是 一 种 缺口 。 但 读 取 数据 的 激光 束 看 到 的 是 太 菊 而 不 是 凹 坑 : 图 3-40 表明， 光盘 有 4 层 ; 
光盘 本 身 厚 约 1.2mm， 由 透明 的 聚 碳酸 酯 塑料 构成 。 止 坑 被 涂 上 三 层 薄 的 锅 ， 后 面 跟 了 一 层 
保护 性 的 丙烯 酸 层 ， 标 签 印 在 最 上 面 标签 这 面 对 划 痕 和 磨损 比 光滑 的 那 面 更 敏感 。 
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1.2 mm 





平面 “四 坑 
图 3-40 CD 的 结构 


透明 CD 表面 的 划 痕 不 会 破坏 数据 ， 尽 管 由 划 痕 导致 的 光 散 射 可 能 增加 错误 率 。 由 于 数 
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据 是 沿 着 轨道 存储 的 ; 因此 介质 对 径 向 划 痕 不 太 人 敏感 而 对 圆周 划 痕 敏感 。 如 果 要 清洁 光盘 ， 
擦拭 应 该 沿 着 径 向 ! 

“CD 的 面 密度 是 轨道 一 圈 记 录 的 数据 位 数 与 轨道 密度 5 A 

的 乘积 革 每 圭 位 的 物理 尺寸 取决 于 照射 到 光盘 表面 光 点 人 æ; © Pe 

的 大 小 。 图 3-41 展示 了 CD 表面 止 坊 和 平面 的 结构 和 尺 © oe o @ 本 Be 4 a 
af so APRA 0.5 x 10%m, 轨道 间隙 为 1:6 x 10“m。 肿块 
CHII AO BER 1.25 x 107m, 


3.7.2 ACD 中 读 取 数据 


Se 将 二 ee 通过 反射 光 强 来 读 到 数据 。 
应 用 现 有 的 半导体 技术 可 以 将 四 坑 做 得 非常 小 不幸 的 是 ， 创建 真正 微小 的 点 是 很 难 
i ry he 

为 了 创建 和 控制 尽 可 能 小 的 光 点 ， 必须 使 用 相干 ( coherent) 光 和 单 色 (monochromatic) 
光 光 束 。 如 果 光 波 都 具有 相同 的 频率 则 为 单 色光 源 ， 不 像 白光 那样 包含 整个 可 如 光谱 的 各 种 
频率 。 如 果 光 波 像 具 有 相同 频率 那样 具有 相同 的 相位 (phase), “ 则 光波 为 相干 光 s 激光 器 是 
产生 单 色 相干 光束 的 装置 ,= 因此， i tla ae me 
导体 部 件 ， 就 像 传 统 的 LED (发 光 三 极 管 ) 那样 。 

CD 的 记录 和 回放 机 制 十 分 巧妙 。 图 :3-42 展示 了 在 盘面 上 激光 点 的 能 量 分 布 。 一 个 完美 
的 光 点 在 明亮 与 黑暗 之 间 有 明显 的 边界 。 然 而 ， 由 于 光 的 波动 性 质 ; 光 点 的 边缘 并 非 界限 分 
明 ; 它 由 二 系列 逐渐 消退 的 光环 组 成 。 

图 3-42 还 说 明了 光 点 轨道 、 四 坑 、 平面 的 相对 尺寸 。 当 光照 射 :CD 表面 平坦 的 区 域 
(平面 )， 光 线 的 大 部 分 被 反射 回来 。 假设 光 点 的 大小 比 单个 肿块 要 大 。 当 光照 射 到 表面 的 肿 
块 时 ， 一 部 分 光 从 肿块 表面 反射 ， 另 一 部 分 光 从 肿块 附近 的 表面 反射 。 

如 果 光 源 不 是 相干 光 ， 光 从 表面 ( 即 平面 ) 反射 还 是 从 肿块 (IMS) RAM KBAK, 
然而 ，CD 中 ， 肿 块 相 比 平面 的 高 度 是 激光 波长 的 四 分 之 一 。 假设 从 光源 发 出 至 盘 片 平面 然 
后 反射 回 观 测 器 的 总 距离 为 x*。 照射 到 肿块 底部 的 光线 的 传输 距离 稍 长 一 些 ， 即 每 个 方向 都 
会 长 4。 因 此 ;从 肿块 底部 返回 光 的 总 的 传输 距离 为 x+4/2。 由 于 光 点 没有 完全 覆盖 一 个 凹 
bt, ;从 四 坑 反 射 回 的 光 与 从 平面 反射 回 的 光 的 传输 距离 相差 为 光波 长 的 二 半 ， 此 时 光波 会 消 
失 。 这 是 相干 光 的 二 种 性 质 。 

从 平面 返回 的 光线 很 强 ， 但 从 止 坑 返 回 的 光线 衰减 
严重 。 因 此 ， 可 以 很 容易 地 检测 平面 和 四 坑 ,， 进一步 可 
以 从 盘 片 中 读 取 数据 。 从 CD 读 取 数据 不 需要 盘 片 表面 
与 读 写 头 部 件 有 任何 的 接触 。 ices 

AA CD 驱动 器 使 用 可 移动 介质 ， 该 介质 必须 用 手 
指 触 磁 ， 存 放 时 容易 蒙 上 灰尘 ， 其 表面 很 可 能 被 一 位 数 
据 对 应 存储 尺寸 大 小 的 颗粒 污染 。 没 有 光盘 驱动 器 可 以 
实现 磁盘 的 工程 精度 ， 该 精度 要 求 读 磁头 与 磁盘 表面 分 
Fum 量 级 的 距离 。 幸 运 的 是 ， 光 点 尺寸 的 问题 可 以 利 
用 制造 CD-ROM 的 洁净 碳酸 酯 的 光学 性 质 来 解决 。 

图 3-43 展示 了 CD 表面 污染 的 影响 是 如 何 被 显著 降 图 3-42 “光束 的 能 量 分 布 
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13-41 CD 的 表面 
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点 大 小 为 1.7hm， 而 照 在 盘 片上 层 透明 表面 的 光 点 大 小 为 800um 透明 表面 光 点 的 大 小 为 昭 
在 凹 坑 和 平面 上 光 点 的 近 500 售 。 这 意味 着 表面 轻微 的 瑕 症 对 聚焦 的 影响 很 小 ， 所 以 光盘 表 
面 对 污染 相对 宽容 。 ; 
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图 3-43 CD 光学 和 光 点 大 小 
照 在 凹 坑 和 平面 上 光 点 的 大 小 可 用 下 式 计算 ， 


fr ioe. 
Pie NA , 

其 中 : NA 为 物镜 的 数值 孔径 (numerical aperture); 2 为 激光 的 波长 。 在 CD-ROM 中 ， 激 光 
的 波长 为 780nm， 数 值 孔径 大 约 是 .0.45。 

数值 孔径 通过 NA=nsind 计算 ， 其 中 半 是 聚 碳酸 酯 的 折射 率 。 材 料 的 折射 率 是 衡量 其 弯 
曲 光 线 的 能 力 ,定义 为 真空 中 的 光速 除 以 介质 中 的 光速 。 数 值 孔径 用 来 衡量 透镜 系统 的 聚 光 
能 力 ， 决 定 了 其 分 辨 能 力 和 景深 。 也 可 以 用 相机 来 解释 ， 其 镜头 的 数值 孔径 与 光圈 (fstop) 
值 成 反比 。 

先 做 一 个 近似 计算 ， 图 3-43 的 几何 计算 表明 盘 片 厚度 和 表面 光 点 尺寸 的 关系 式 
tan0=s/24,， 其 中 4 是 盘 片 的 厚度 ，s 是 光 点 的 直径 。 对 于 较 小 的 2 值 ，tanb=sin， 因 此 ， 

s=2dsin0=2dNA/n l 

Ht, d 为 盘 片 的 厚度 ; NM 为 物镜 的 数值 孔径 ; N 为 盘 片 材料 的 折射 系数 。 

设计 CD 读 取 部 件 需要 考虑 的 另 一 个 重要 因素 是 景深 (depth of focus); 也 就 是 说 ,， 光 点 
可 以 聚焦 的 范围 。 景 深 越 小 ， 激 光 点 就 越 难 跟踪 移动 着 的 盘面 。 景 深 可 以 表示 为 : 

dioos TANINA? 

其 中 , 4 为 激光 的 波长 ; n 为 材料 的 折射 率 ; NA 为 数值 孔径 。 

CD 驱动 器 中 使 用 激光 的 波长 区 间 为 670 ~ 690nm (红外 波段 )。 更 短 的 波长 允许 更 小 
的 四 坑 和 平面 ， 因 而 导致 更 高 的 密度 ， 这 一 点 在 稍 后 讨论 。 可 以 用 图 3-43 来 估计 CD-ROM 
的 最 大 理论 容量 。 假 定 一 个 光 点 可 以 存储 一 位 数据 ， 其 总 容量 为 盘 片 的 面积 除 以 该 光 点 的 面 
积 。 如 果 Router 为 盘 片 外 径 ， 而 Rime 为 盘 片 内 径 ， 则 光盘 的 数据 存储 区 域 为 Roster 一 zeRinner 。 

光 点 的 面积 是 由 x(rwyw/2) 给 出 ，rspor 为 直径 。 因 此 光盘 的 容量 为 : 


容量 a R his cR 


( 1.224 J 
2NA 


136 B3F 


二 如 果 将 典型 值 代入 此 公式 ?， 可 以 得 到 :CDi 的 理论 最 大 容量 为 2.5GBs 实际 上 ， 不 可 能 实 
现 该 容量 ,部 分 是 因为 光盘 需要 存储 纠 错 码 。 


gg a a a ec ae Dut Na a aan i i ASU a ei ai li PRU ty 


IN AGE 


T 7 Z PRESE FE ee 





“1. 光盘 的 速度 

音频 CD 的 速度 由 从 盘 中 读 取 所 需 数据 的 速度 来 衡量 。 与 150KB/s 的 数据 传输 率 相 对 应 
的 速度 被 称 为 1X (一 倍速 )。 以 这 个 速度 ， 读 头 下 盘 片 表面 运动 的 速度 为 1.25m/s。 因 为 用 
户 需 要 尽 可 能 快 地 读 取 数 据 ， 光 驱 从 产生 后 便 不 断 变 得 更 快 。4X 驱动 器 可 以 以 标准 音频 光 
盘 4 倍 的 速度 提供 数据 。 工 作 在 48X 的 驱动 器 如 今 已 经 司空 见 惯 。 然 而 ， 对 驱动 器 进行 基 
准 测试 的 组 织 公 布 的 测试 结果 表明 ， 这 些 驱动 器 不 能 提供 用 户 期 待 的 持续 数据 传输 率 。48X 
光盘 驱动 器 的 速度 并 不 是 1X 光盘 驱动 器 的 48 倍 。 

与 硬盘 不 同 ， 第 二 代 的 'CD 驱动 器 以 恒定 线 速 度 (constant linear velocity, CLV) 运转 。 
恒定 线 速度 意味 着 读 头 下 方 盘 片 表面 的 速度 是 常量 。 硬 盘 以 恒定 角 过 度 (constant angular 
velocity, CAV) 运转 。 因 为 盘 片 中 心 和 边缘 的 半径 有 很 大 差异 ， 读 取 光 盘 时 ， 以 恒定 速度 
读 取 数据 所 需 的 旋转 速度 各 不 相同 。 该 特性 限制 了 CD-ROM 驱动 器 的 速度 。 

现代 CD-ROM 驱动 器 在 很 大 程度 上 放弃 了 纯粹 的 CLV， 因 为 在 高 速 旋转 时 很 难 实现 。 
一 些 驱动 器 使 用 了 双 模式 ， 在 靠近 光盘 中 心 时 使 用 恒定 角速度 读 取 数据 ， 而 在 靠近 光盘 边缘 
时 使 用 恒定 线 速度 来 读 取 数据 。 然 而 ， 当 前 的 光驱 为 DVD (或 蓝光 ) 驱动 器 ， 它 可 以 向 后 兼 
容 ， 可 以 读 取 CD, 

2. 光学 读 头 

下 面 介绍 从 光盘 中 读 取 数据 的 完整 光学 系统 。 图 3-44 显示 了 激光 从 激光 器 发 出 到 达 盘 
片 表面 ， 然 后 再 回 到 光电 传感器 的 路 径 。 本 质 上 说 ， 从 激光 器 发 出 的 光 穿 过 了 一 系列 镜头 ， 


© Lane, P. M. and Van Dommelen, R., “Compact Disc Players in the laboratory,” IEEE Transactions on Education, Vol. 
44, No. 3, Frbruray 2001, pp47-60. 
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聚焦 到 盘 片 上 的 一 个 点 。 nip 反射 光 的 强度 取决 于 光 点 照 在 止 坑 还 
是 平面 上 。 


激光 器 准 直 透 镜 yyy 
偏振 光束 分 光 器 Caka 





Bp 
X 
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光电 二 极 管 阵列 
图 3-44 读数 据 


当 光 从 盘 片 返回 时 ， 它 碰 到 了 分 光 器 ， 部 分 光 被 向 下 反射 到 可 检测 光 的 传感器 。 光 电 二 
极 管 可 以 检测 从 盘面 反射 的 光线 强度 。 如 果 从 盘面 反射 回 的 光 来 自 肿 块 ， 部 分 光 多 传输 了 
4/2 并 变 成 180。 异 相 ， 则 导致 探测 器 中 信号 电 平 下 降 。 

3. 聚焦 和 跟踪 

为 了 可 靠 地 读 取 数据 ， 光 驱 的 读 头 必须 精确 地 对 准 螺旋 光 道 。 沿 着 半径 方向 可 以 很 容易 
地 移动 光学 装置 。 但 是 很 难 将 激光 以 必要 的 精度 对 准 所 需 的 位 置 。 该 问题 对 在 X 了 平面 上 和 寻 
道 以 及 在 Z 方 向 聚焦 时 都 存在 。 

读 头 中 的 物镜 安装 了 平衡 环 ， 可 以 在 两 个 平面 运动 : 左右 运动 来 实现 跟踪 ; 内 外 运动 来 
实现 聚焦 。 使 用 电磁 铁 的 磁场 可 以 定位 物镜 来 进行 高 精度 的 跟踪 和 聚焦 。 

数据 跟踪 的 方法 很 巧妙 (有 几 种 变形 )。 为 了 理解 跟踪 和 聚焦 ， 必 须 了 解 光 传 感 器 。 图 
3-45 显示 了 全 部 6 个 光学 传感器 。 来 自 激光 器 的 光 首 先 通过 衍射 光栅 (diffraction grating), 
它 是 一 种 具有 平行 刻 线 的 透明 材料 。 衍 射 光栅 的 作用 是 把 单 束 光 分 割 成 一 个 主 光束 和 两 个 侧 
光束 。 








4 个 主 传感器 
a) 激光 聚焦 b) 激光 散 焦 


图 3-45 ”使 用 光 传 感 器 读数 据 以 及 进行 聚焦 / 跟踪 


ERRA BL CA DRIER. ERA EA FERMI. 这 两 个 侧 光束 传 
感 器 的 输出 相 减 可 以 获得 跟踪 误差 〈trackso=E-R)。 如 果 光 束 集中 ， 跟 踪 误 差 为 0。 MR 
track,....>0, MIRE EMAK, 如 果 trackua<0， 则 光束 需要 向 右 移 。 

主 光束 落 在 传感器 4、B、C 和 DD 上 ,这 些 传感器 输出 的 总 和 用 来 重新 生成 来 自 盘 片 的 
数据 。 一 对 传感器 之 间 的 输出 差异 可 以 用 来 对 光 点 进行 聚焦 。 

在 图 3-45 中 ; 来 自 衍射 光栅 的 光束 通过 准 直 透 镜 变 成 了 平行 光束 ， 再 通过 四 分 之 一 波 
片 以 及 一 个 物镜 将 光束 聚焦 到 盘 片 上 。 这 些 光 束 沿 着 同样 的 路 径 返 回 ， 然 后 通过 分 光 器 到 达 
6 个 传感器 。 
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物镜 是 圆柱 形 (cylindrical) 而 非 球面 (spherical); 这 导致 了 散光 ; 也 就 是 说 ;焦点 在 垂 
直面 和 水 平面 上 是 不 同 的 。 如 果 光 束 聚 焦 ， 光 点 就 是 圆 形 ， 所 有 4 个 中 央 传 感 器 将 获得 相同 
的 能 量 。 如 果 镜 头 离 表面 太 近 ， 光 点 就 是 个 椭圆 ， 如 图 3-45b 所 示 ， 信 号 (4+D) HE (B+C) 
的 能 量 高 。 该 差 值 可 用 于 将 镜头 向 远离 盘 片 方向 移动 。 如 果 镜 头 离 表面 太 远 ， 散 光 的 效果 则 
是 旋转 90° 的 椭圆 ， 使 信号 (B+C) E (4+D) 的 能 量 高 。 

4. 缓冲 区 欠 载 

与 光盘 相 比 ， 磁 盘 中 的 扇 区 可 以 快速 定位 。 此 外 ， 磁 盘 也 可 以 快速 地 写 入 。 将 数据 写 人 
光学 介质 更 为 复杂 。 如 果 在 写 过 程 中 出 现 错误 ， 可 能 就 会 损坏 介质 而 被 丢弃 。20 世纪 90 年 
RA, HI CD 是 非常 普遍 的 ， 通 常 使 用 杯 托 (coaster) 这 个 词 来 形容 使 用 损坏 的 CD-R9 
作为 咖啡 杯 的 垫子 。 当 光驱 写 CD-R 时 需要 连续 的 数据 流 。 数 据 流 中 最 微小 的 空隙 也 是 致命 
的 。 因 为 在 写 CD 时 , 来 自主 机 处 理 器 的 数据 被 存储 在 CD 驱动 器 的 缓冲 区 中 ， 出 现 缓冲 区 
空 的 情况 被 称 为 缓冲 区 欠 载 (buffer underrun )。 

这 种 缓冲 区 从 载 问题 是 记录 CD 最 大 的 问题 之 一 ， 每 当 CD 驱动 器 较 快 而 数据 收集 较 慢 
或 处 理 器 在 写 CD 时 意外 中 断 就 会 发 生 。 到 2000 Æ, CD-R 和 CD-RW 驱动 器 制造 商 通过 提 
供 缓 冲 区 欠 载 解决 方案 而 相互 竞争 。 

首先 解决 该 问题 的 造 商 之 一 是 Sanyo, EA] BURN-Proof™ (防止 缓冲 区 欠 载 ) 技术 这 个 
术语 来 描述 其 系统 。Sanyo 的 机 制 是 定期 检查 数据 缓冲 区 的 状态 。 如 果 缓 冲 区 清空 得 过 快 ， 
CD-RW 的 固件 将 干预 处 理 该 情况 。 用 户 所 要 做 的 就 是 写 完 当前 帧 ， 然 后 等 到 缓冲 区 再 次 被 
充满 。Plextor 扩展 了 Sanyo 的 BURN-Proof 技术 ， 它 定期 抽样 记录 的 数据 来 检查 其 质量 ， 
允许 驱动 器 将 盘 片 的 速度 更 改 为 更 为 合适 的 值 。 

Yamaha 公司 开发 出 一 种 缓冲 问题 的 解决 方案 ， 称 为 SafeBurn“。Yamaha 的 系统 既 避 
免 出 现 缓冲 区 溢出 也 进行 写 速度 的 优化 。SafeBurn 技术 使 用 相对 较 大 的 8MB 的 缓冲 (当时 
其 竞争 对 手 只 使 用 2MB 的 缓冲 )。 如 果 缓 冲 区 中 的 数据 量 开 始 降 到 危险 的 水 平 ， 写 操作 像 
BURN-Proof 技术 那样 被 挂 起 。Yamaha 的 SafeBurn 技术 的 第 三 个 组 成 部 分 是 一 种 检查 被 写 
盘 片 特性 以 优化 记录 参数 的 机 制 s 


3.7.3 ”底层 数据 编码 


盘 片 上 数据 的 编码 受到 几 个 严格 条 件 的 制约 一 一 最 重要 的 是 来 自 光 学 传感器 的 信号 光谱 
的 能 量 分 布 ( distribution of energy in the spectrum of the signal) 。 特 别 是 ， 信 和 号 中 应 该 没有 
直流 分 量 ; 也 就 是 说 ， 其 平均 值 必须 为 0 (这 是 电路 自然 属性 的 结果 ， 它 只 能 传输 随时 间 变 
化 的 信号 ， 而 不 能 传输 常量 信号 )。 因 此 ， 必 须 设计 底层 数据 编码 用 来 控制 连续 的 0 位 或 1 
位 的 数量 并 允许 从 数据 信号 中 提取 时 钟 信号 ( 自 同步 能 力 )。 

源 数据 以 8 位 二 个 字 节 为 单位 进行 存储 。 这 些 数据 字 节 都 通过 8 ~ 14 位 调制 (EFM) 
被 编码 成 14 位 。 每 个 14 位 的 编码 可 以 表示 224=16376 个 不 同 的 值 ， 尽 管 其 中 只 有 25=256 
个 值 被 使 用 。EFM 是 一 种 游程 长 度 受 限 (run length limited) 码 ， 它 减少 了 信号 的 带宽 。 
EFM 编码 确保 盘 片 上 的 数据 流 中 有 少 于 10 个 且 多 于 2 个 连续 的 0。 BRE, 有 267 个 合法 
(legal) 的 14 位 编码 符合 规则 : 数据 流 中 连续 的 0 的 数量 介 于 3 和 9 之 间 (包含 3 和 9 )。 这 
意味 着 调制 机 制 有 267-256=19 种 编码 是 合法 的 、 但 没有 用 来 描述 有 效 的 数据 字 节 。 因 此 这 


日 “CD 写 后 就 不 能 更 改 。CD-R 是 可 以 写 一 次 的 CD。CD-RW 是 可 以 写 、 擦 除 ， 然 后 再 重 写 的 CD。 
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些 代码 可 以 在 数据 流 中 用 作 特 殊 标 记 。 
数据 中 逻辑 1 的 值 被 解释 为 来 自 盘 片 信号 状态 的 变化 ( 即 从 平面 变 为 四 坑 , 反之 亦 然 )， 
1 就 是 通过 记录 止 坑 的 开始 和 结束 来 表示 的 。 图 3-46 说 明了 数据 流 和 盘面 记录 情况 之 间 的 


001000001000100100000000100100 
数据 流 ， 每 个 1 处 出 现 脉冲 


NRZI 编码 ， 出 现 1 脉冲 
后 数据 翻转 
Myst Fi 


激光 点 
图 3-46 数据、 编码 和 轨道 结构 


不 幸 的 是 ,很 可 能 会 出 现 一 组 的 结束 和 下 一 组 的 开始 被 解释 为 有 效 编码 字 的 情况 。 为 阻 
止 这 种 情况 的 发 生 ， 在 每 14 位 一 组 间 需 要 增加 3 位 分 隔 符 。 这 3 位 被 称 为 合并 位 【merging 
bit)。 组 成 合并 码 的 3 位 并 不 总 是 相同 的 。 选 择 特定 的 合并 码 通 常用 来 确保 1 和 0 的 数量 基 
本 相同 (该 限制 确保 从 光头 中 读 出 的 数据 中 没有 直流 分 量 )。 

CD 上 的 底层 数据 结构 十 分 复杂 ;这 是 由 于 纠 错 编 码 机 制导 致 的 ， 它 将 光盘 记录 从 本 质 
上 不 可 靠 的 存储 转换 为 可 靠 的 存储 。 光 介质 暴露 在 空气 中 并 通过 用 户 转 递 使 得 它们 很 容易 受 
到 污染 ME, 记录 介质 也 有 制造 方面 的 缺陷 ， 回 放 机 制 也 受到 振动 和 其 他 干扰 的 影响 。 进 
而 ， 相 对 于 硬盘 而 言 ， 从 光盘 中 读 取 的 数据 很 可 能 会 有 较 高 的 错误 率 。 确 实 ， 光 盘 与 磁盘 出 
错 率 有 好 几 个 数量 级 的 差异 。 

光 介质 使 用 集中 检 错 和 纠 错 机 制 。 纠 错 是 区 分 音频 光盘 和 记录 数字 数据 的 CD-ROM 的 
主要 特点 。 数 据 光 盘 具 有 较 高 的 纠 错 能 力 。 出 于 这 个 原因 ， 音 乐 CD 可 以 存储 比 数据 光盘 更 
多 的 数据 位 。 

光 存 储 中 使 用 的 基本 纠 错 机 制 被 称 为 交叉 里 德 - 索 洛 蒙 码 ( Cross Interleaved Reed- 
Solomon，CIRC)。 交 叉 是 一 种 简单 的 技术 ， 它 在 记录 字 节 时 将 其 顺序 重新 排列 ， 以 确保 长 
的 突 发 错误 只 影响 不 同 数据 帧 的 一 小 部 分 字 节 而 不 是 损坏 一 个 或 多 个 相 邻 数据 帧 的 许多 位 。 
换 句 话说 ,长 的 突 发 错误 被 重新 分 配 为 多 个 短 的 突 发 错误 。 这 些 短 的 突 发 错误 通常 可 以 被 
纠正 。 

下 面 来 看 音频 光盘 的 格式 。 数 字 化 声音 信息 最 开始 为 多 个 16 位 数值 对 ， 每 个 样本 是 分 
别 对 左 和 右 声 道 采样 的 结果 。 这 些 数据 被 组 合 为 24 字 节 的 帧 。CIRC 机 制 使 用 这 24 字 节 的 
数据 帧 产生 28 字 节 的 输出 。 额 外 的 4 个 字 节 是 RS (里 德 - 索 洛 蒙 ) 编码 器 创建 的 纠 错 信 息 。 
28 字 节 的 数据 然后 被 传递 给 第 二 个 RS 编码 器 生成 32 字 节 的 帧 ， 进 一 步 添加 了 4 个 字 节 的 
纠 错 信息 。 这 种 编码 机 制 旨 在 防止 一 位 和 多 位 突 发 错误 。 在 帧 中 添加 了 一 个 字 节 的 子 码 ， 其 
原因 稍 后 解释 。 X 

使 用 8 ~ 14 位 编码 并 在 前 面 增加 24 位 同步 码 来 对 信息 进行 编码 。 在 每 个 数据 字 节 间 增 
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加 3 位 的 合并 码 ， 但 同步 码 内 不 需要 。 因 此 ， 总 的 位 数 为 : 

24 个 同步 位 +3 个 合并 位 

1 个 字 节 的 子 码 需 要 1x(14+3) 位 

24 个 字 节 的 数据 需要 24 x (14+3) 位 

8 个 字 节 的 奇偶 校 验 码 需要 8 x (14+3) 位 

这 些 加 起 来 为 588 位 。 注 意 这 588 位 是 如 何 被 用 来 编码 24 x 8=192 位 数据 的 。 

这 些 帧 被 组 织 成 98 个 帧 一 块 ， 每 块 包含 98 x24=2352 字 节 的 音频 数据 。 音 频 CD RK 
动 器 以 1 倍速 操作 ， 每 秒 读 取 75 块 ， 相 应 的 数据 传输 率 为 2353 字 节 x8 位 x75 块 / 
s=1411800 {iz /s ( 即 1.4Mb/s)。 

每 秒 音频 样本 的 数量 为 12 个 样本 / tt x 98 ER x75 块 /s=88200 样 本 /s (或 每 秒 每 声 道 
44.1K 个 样本 )。 该 值 当然 就 是 音频 CD 对 应 的 基本 数据 传输 率 。 来 自 CD 的 数据 传输 率 为 
98 Wi x 588 位 / 帧 x 75 块 /s=4321800 fiz /s (4.3Mb/s)。 

图 3-47 显示 了 音频 CD 上 的 3 层 结 构 。 图 3-47a 中 ， 每 块 由 98 帧 组 成 。 每 帧 包含 一 个 
单字 节 的 子 码 ， 其 中 包含 当前 光 道 的 相关 信息 等 等 。 





b 每 帧 包含 同步 码 ， FER, Sorry er 


Tl, ze 
Saat E i 信息 的 14 位 编码 ， 
c) 帧 的 精确 结构 : 8 位 数值 被 编码 为 14 位 ， 每 组 间 包 含 3 个 合并 位 


图 3-47 音频 CD 上 的 数据 结构 


需要 98 帧 来 构成 完整 的 子 码 。 子 码 的 位 代表 了 8 个 通道 P、Q、R、S、T、U、V 和 W。 
P 子 码 用 于 指定 音 轨 之 间 的 分 隔 符 ，Q 子 码 包 含 盘 片 的 目录 以 及 音 轨 的 位 置 。 其 他 子 码 一 般 
不 使 用 。 子 码 由 一 块 中 的 98 个子 码 字 节 组 成 ， 开 始 有 两 个 特殊 的 14 位 同步 码 ， 与 正常 的 
256 个 数据 代码 不 符 。 这 意味 着 子 码 块 可 以 被 唯一 标识 。 子 码 块 也 包含 自己 的 16 位 循环 宛 
余 码 来 进行 错误 保护 。 

图 3-47b 显示 了 由 24 字 节 音频 数据 、 同 步 头 、 子 码 字 节 和 由 里 德 - 索 洛 蒙 编码 器 生成 
的 奇偶 校 验 字 节 组 成 的 帧 结构 。 图 3-47 实际 上 是 误导 ， 因 为 数据 的 顺序 已 被 CIRC 编码 器 
FTAL 

图 3-47c 说 明了 帧 的 位 结构 ， 包 括 24 位 唯一 的 同步 码 和 连续 的 14 位 信息 单元 ， 每 个 单 
元 被 3 位 合并 码 隔 开 。 

CD-ROM 的 编码 更 加 复杂 ， 因 为 加 入 了 额外 数据 纠 错 机 制 来 进一步 降低 不 可 纠正 的 错 
误 率 。 音 频 信号 比 数字 数据 更 能 容忍 错误 。 在 音频 样本 流 中 偶尔 丢弃 一 位 不 会 产生 大 问题 ， 
这 是 因为 由 此 产生 的 声音 王 扰 会 很 短暂 ， 可 能 部 分 被 音频 处 理 电路 过 滤 掉 。 在 数据 信号 中 丢 
弃 即 使 是 一 位 也 会 产生 严重 的 影响 ， 特 别 是 数据 表示 代码 的 时 候 。 
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CD-ROM 的 结构 类 似 于 音频 ROM :其 目的 是 提供 两 种 系统 之 间 的 兼容 性 。 因 此 ， 使 用 
相同 的 帧 结构 和 底层 编码 。 98 帧 的 一 抉 被 称 为 扁 区 (sector)， 可 以 存储 2048 字 节 的 用 户 数 
据 。 这 种 安排 意味 着 ，2336 个 音频 字 节 可 以 存储 在 一 个 扁 区 中 ，2336-2048=288 个 字 节 可 用 
于 额外 的 纠 错 。 

当 读 取 音 频 CD 时 ， 数 据 传输 率 为 75 HK /s x 2048 字 节 / 帧 =153600 FH /s, KAW 
150KB/s， 当 然 就 是 1X (1 倍速 ) 的 数据 传输 率 。 


CD-ROM 有 3 种 数据 模式 。 模 式 0 具有 与 其 他 模式 相同 “ 表 3.5 CD-ROM Biat 1 


的 基本 结构 ， 但 其 所 有 数据 字段 均 为 0 ( 即 数据 字段 为 空 )。 模 一 ee __ 


式 1 用 于 数据 CD 而 模式 2 用 于 音频 CD。 表 3-5 说 明了 模式 
1 的 数据 结构 ， 表 3-6 说 明了 模式 2 的 数据 结构 。 

由 于 模式 1 提供 的 数据 块 具 有 2K=22 个 字 节 ， 对 主机 系 
统 来 说 ，CD 看 起 来 像 其 他 的 大 容量 存储 设备 。 如 表 3-5 所 示 ， 
数据 轨道 被 分 为 若干 包含 2352 字 节 的 扇 区 。 每 个 肩 区 包括 12 
位 的 同步 字段 和 含有 扇 区 地 址 及 其 模式 的 头 字段 ;光盘 的 扇 区 
地 址 不 同 寻常 ， 因 为 它 通 过 时 间 (time) 来 定义 。 这 类 似 于 通 ” 表 3-6 CD-ROM 模式 2 的 扇 
过 飞机 从 起 点 以 恒定 的 速度 到 达 指 定 地 点 所 花费 的 时 间 来 计算 区 数据 结构 
飞机 的 位 置 。 地 址 表示 为 分 : 秒 : BK. FRB A, 模式 2 
这 样 3 字 节 编 码 C0i6: 3216: 2l 将 代表 位 置 32 分 50 秒 33 扇 ， -同步 字段 
K; 也 就 是 说 ， 分 字段 的 值 比 实际 值 大 A0is。 在 模式 2: 的 帧 一 头 字段 
中 ， 所 有 2336 个 字 节 都 可 用 于 用 户 数据 。 这 种 模式 可 以 用 于 -用户 数据 字段 
视频 或 音频 编码 。 bade tat 


3.7.4 可 记录 光盘 


可 记录 光盘 是 “ 橙 皮 书 ”第 开 部 分 的 主题 ， 第 一 款 CD-R 机 器 于 1993 年 首次 出 现 。 可 
记录 CD 驱动 器 与 只 读 变种 的 区 别 不 是 很 大 。 主 要 的 区 别 是 介质 。 可 记录 CD 使 用 双 层 技 
RK, 在 染色 层 后 有 反射 层 。 如 果 光 照射 到 染色 层 ， 它 就 会 被 吸收 ;如果 它 照 到 反射 层 ， 它 就 
会 被 反射 回来 ; 记录 数据 的 方法 是 使 用 激光 在 染色 层 烧 一 个 洞 至 反射 层 。 由 于 这 个 原因 ， 人 
们 有 时 使 用 烧 录 CD 来 表示 向 空白 CD 写 人 数据 。 

最 初 的 染色 剂 是 基于 青色 素 的 。 今 天 ， 人 大 们 使 用 更 现代 的 染色 剂 来 适应 由 于 紫外 线 而 导 
致 的 数据 退化 和 更 高 速 的 写 操作 。 反 射 层 可 能 是 黄金 ， 这 是 由 于 其 良好 的 稳定 性 和 抗 腐蚀 能 
Jo CD-R 光盘 在 制造 时 印 制 的 螺旋 轨迹 具有 与 CD 相同 的 宽度 和 间距 。 

1; 可 重 写 CD 

为 使 CD-RW 技术 与 现 有 的 CD 驱动 器 兼容 ， 有 必要 找到 一 种 方法 , 沿 着 光 轨 创建 和 删 
_ 除 不 同 反射 率 的 区 域 。 两 个 主要 的 方法 是 相 变 (phase-change) 和 磁 光 ( magneto-optical) 技 
AR. Panasonic 和 其 他 公司 开创 了 磁 光 存储 。 然 而 ，CD-RW 设备 已 普遍 采用 相 变 技术 。 

增加 聚焦 激光 束 的 功率 可 以 在 本 地 加 热 光 盘 表 面 的 数据 记录 层 。 该 层 包 含 银 、 锣 、 锁 和 
磅 的 混合 物 ， 它 存在 两 个 稳定 状态 : mA (crystalline) 和 非 晶 态 (amorphous). 当 这 种 材料 
处 于 晶 态 时 ， 它 反射 激光 的 能 力 比 非 晶 态 时 要 强 。 





12 字 节 

4 字 节 
2048 字 节 
288 字 节 





O ” 橙 皮 书 发 表 于 1990 年 ， 是 Philips 和 Sony 定义 的 一 系列 可 记录 CD 标准 的 非 正式 名 称 。 在 红皮书 (CD Ë 
频 )、 黄 皮 书 (CD-ROM) 和 蓝皮书 (增强 CD) 中 还 有 其 他 光 存 储 器 标准 。 
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CD-RW 光盘 本 身 与 传统 的 CD AWM. AEA 1.2mm 的 聚 碳 酸 酯 盘 ， 光 轨 ( 即 螺旋 槽 ) 
塑造 在 盘 片 上 并 具有 时 间 信 息 。 记 录 层 夹 在 两 个 介 电 县 (dielectric layer) 之 间 ， 可 以 在 相 变 
层 写 或 擦 除 过 程 中 被 加 热 时 控制 其 热 特 性 。 数据 层 和 介 电 层 之 后 是 反射 层 。 


CD 标准 
随 着 CD 的 发 展 ， 不 断 出 现 新 标准 以 适应 其 特性 和 应 用 的 变化 。 传 统 上 ; 每 组 新 标 
准 被 称 为 书 ( book)， 特 定 的 书 被 赋予 一 种 颜色 。 第 一 个 标准 是 为 紧密 光盘 数字 音频 系统 
制定 的 红皮书 标准 。 黄 皮 书 标准 针对 用 来 存储 数字 数据 的 CD-ROM， 黄 皮 书 标准 进行 
了 扩展 ， 包 括 定义 了 包含 计算 机 数据 和 编码 的 音频 和 视频 信息 的 CD-ROM 格式 的 CD- 
ROM/XA 扩展 标准 。 - 
“平一 个 标准 是 绿 友 书 ， 它 定义 了 交互 式 紧 密 光 盘 (Compact Disc Interactive, CD- ED 
的 格式 CD-I 为 广大 消费 者 的 交互 多 媒体 应 用 程序 提供 了 平台 ; 
- HERRI- KER BALM. 欧洲 计算 机 制造 商 协会 创建 的 ECMA 168 4% © 
准 包含 了 橙 皮 书 。 该 标准 统治 了 一 次 写 CD 4 CD-ROM TH, 包括 多 区 段 记录 ; FRX 
| - 件 名 约定 以 覆盖 Unix 风格 的 文件 名 。 最后， 蓝皮书 包括 了 激光 唱 盘 的 标准 ; 用 于 存储 
视频 和 声音 数据 。 :但 其 现在 已 基本 过 时 
«HE RB CD-R 标准 将 CD 分 为 系统 使 用 区 (System Use Area, SUA) 和 信息 区 ， SUA 
定义 了 光盘 上 数据 的 格式 和 类 型 。 SUA- 又 进一步 被 分 为 功率 校准 区 (Power Calibration 
Area, PCA). foi AAE (Program Memory Area, PMA), PCA 为 激光 提供 了 试验 场 。 
该 区 域 多 许 驱 动 器 为 每 个 记录 光盘 校准 激光 功率 。 记录 光盘 被 校准 后 将 某 位 设置 为 ls 
wos 保存 用 户 数据 的 信息 区 从 引入 包含 Q 子 通道 目录 开始 。 在 引入 区 进行 同步 在 数据 
后 就 是 引出 区 ， 它 们 包含 了 数据 并 定义 CD 的 末尾 。 
高 山 (high sierra) 文件 标准 在 主机 操作 系统 和 CD-ROM 之 间 提 供 了 一 个 接口 。 该 
标准 被 国际 标准 组 织 接受 为 JSO 9660 标准 ， 适 用 于 只 读 介 质 。 EAE Baker | 5 
METERON, 

高 山 文件 系统 是 层次 化 的 ， 入 CD 都 具有 根 目 录 。 因 为 CD 本 质 上 是 一 种 慢 速 的 
[| 层次 结构 可 能 会 使 在 目录 间 搜 索 花 费 很 长 二 段 时 间 六 高 山 文 件 系统 在 每 卷 中 使 用 
单独 的 路 径 表 来 描述 文件 层次 结构 并 加 以 缓存 。 文 件 命名 约定 比 Wind6ws 更 严格 ,文件 
名 限定 为 8 个 字符 、 TERORA 个 字符 的 扩展 名 。 fous 文件 名 不 能 包含 除了 下 划 线 

之 外 的 特殊 字符 。 
”ISO 9660 标准 为 CD-ROM 设计 ; pe 4 TRIO Ro ISO 
13346 新 标准 ， oe AEE ob BBX (Universal 
Disk Format, UDF). 
“ISO 13346 最 重要 的 特 wae KROEN chiias writing), ISO 9660 IRLA 
0 需要 这 些 信 息 来 创建 指向 光盘 上 文件 物理 位 
“ 置 的 指针 。ISO 13346 使 用 包 写 入 技术 允许 在 任何 时 候 将 文件 添加 到 CD-R 和 CR-RW 光 
” 盘 中 。 在 每 个 包 写 入 会 话 结束 时 ， 虚 拟 分 配 表 (virtual allocation table) RENNIE i 
| 描述 每 个 文件 的 物理 位 置 。 每 个 新 创 建 的 虚拟 分 配 表 都 包括 以 前 的 表 。 


ee 


CD-RW 驱动 器 中 的 激光 有 .3 种 功率 ;在 读 操作 时 ， 它 提 供 了 检测 凹 坑 边 缘 的 光束 ， 在 
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最 低 功率 模式 下 运行 。 在 写 操作 过 程 中 ， 对 记录 层 表 面 进 行 加 热 以 创建 非 晶 态 时 ， 激 光 在 最 
高 功率 模式 下 运行 。 写 功率 将 表面 局 部 加 热 到 大 约 600"。 当 其 快速 冷却 时 ， 液 体 冻结 和 收 
缩 将 创建 一 个 四 坑 。 

当 CD-RW 驱动 器 擦 除数 据 时 ， 激 光 在 比 写 操作 低 的 功率 模式 下 运行 ， 激 光 对 表面 充分 
加 热 到 数据 层 转 化 为 晶 态 。 相 变 材料 加 热 到 200%CC， 变 为 晶 态 ， 原 子 成 为 有 序 状态 。 为 保证 
继续 提供 光学 可 区 别 的 状态 ， 材 料 可 以 允许 的 写 和 擦 除数 量 是 有 限 的 。CD-RW 仍然 是 一 种 
多 数 时 间 为 读 的 介质 ， 而 不 是 完全 意义 上 的 读 / 写 介质 。 

2. 磁 光 存储 

与 相 变 技术 相对 应 的 另 一 个 方法 是 磁 光 ( magneto- 
optical, MO) k. MO 系统 不 能 与 传统 的 CD 驱动 器 完全 兼 
容 ， 低 成 本 的 CD-RW 驱动 器 的 兴起 导致 MO 技术 的 没落 。 

回忆 前 面 讲 的 居 里 温度 ， 它 定义 了 磁性 材料 退 磁 的 温 
度 。 有 些 物 质 的 居 里 点 有 -200‘C， 这 意味 着 它们 可 以 通过 
激光 加 热 而 退 磁 。 图 3-48 说 明了 MO 系统 的 原理 。 携 带 数 pg rE i I 
据 的 盘面 由 具有 低 居 里 点 的 铁 磁 材 料 构 成 。 在 正常 操作 中 ， nn 
表面 磁场 被 磁化 为 盘面 的 垂直 方向 。 如 果 表 面 被 激光 加 热 ， “””。 Rean 
它 将 会 退 磁 。 然 而 ， 由 于 盘面 下 有 一 个 电磁 铁 ， 当 表面 冷 
却 时 将 导致 磁场 翻转 。 

MO 盘 可 以 通过 磁性 和 光 之 间 的 互动 进行 读 取 。 当 偏振 光 通 过 磁性 材料 ， 将 会 改变 光 的 
偏振 。 这 种 现象 被 称 为 克 尔 效应 (Kerr effect). 

类 似 CD 的 光学 系统 可 以 用 来 读 取 MO 光盘 。 当 光线 从 盘 片 反射 回来 时 ， 如 果 表 面 被 
磁化 其 偏振 面 将 旋转 约 0.3"， 而 如 果 表 面 磁化 翻转 则 其 偏振 面 将 向 另 一 个 方向 旋转 0.5°。 
因此 ， 两 种 磁 状 态 反射 回 的 光 的 偏振 面 有 1? 的 差异 。 光学 系统 和 传感器 能 够 检测 到 这 种 
差异 。 


聚 碳酸 酯 
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3.7.5 DVD 


DVD 是 CD 的 创新 发 展 产 物 ， 它 的 意思 是 数字 视频 光盘 (digital video disc) 或 数字 通用 
AF (digital versatile disc); 似乎 没有 人 知道 哪 一 个 才 是 正确 的 。 重 要 的 是 经 过 优化 后 CD 
可 以 存储 约 75min 高 质量 的 音频 ， 而 DVD 可 以 存储 一 部 电影 。 不 同 于 CD-ROM, DVD 具 
有 几 种 容量 ， 这 取决 于 它 具 有 一 个 还 是 多 个 数据 记录 层 。DVD 技术 在 20 世纪 90 年 代 初 由 
Toshiba, Time Warner, Sony 和 Philips 等 公司 人 研发。 

一 些 DVD 技术 的 发 展 与 好 莱 坞 有 密切 的 联系 ， 好 莱 坞 强烈 影响 着 新 兴 标 准 。 特 别 是 ， 
DVD 设计 用 来 存储 133min 的 视频 信息 编码 (足以 覆盖 大 多 数 主流 电影 )。DVD 提供 了 高 质 
量 的 视频 和 音频 ， 包 括 3 个 独立 的 声 道 ， 使 得 相同 的 DVD 可 以 被 不 同 国籍 的 观众 观看 。 声 
道中 还 包括 杜 比 降 噪 编码 ， 可 以 作为 家 庭 影院 (home theater) 技术 的 基础 ， 杜 比 编码 大 约 在 
1991 年 开始 出 现 。 

DVD 技术 和 CD 技术 几乎 是 一 样 的 。 事 实 上 ， 可 以 说 DVD 就 是 拥有 发 展 并 成 熟 了 10 
年 以 上 技术 的 CD。DVD 光盘 的 止 坑 更 加 紧密 ， 最 小 止 坑 的 大 小 是 0.4um, iii A CD 使 
FAHY 0.83pm. 激光 波长 从 780nm 减少 到 640nm。 同 样 ,， 道 间距 从 1.6m 减少 到 .0.74hmes 
图 3-49 说 明了 CD 和 了 DVD 光 轨 的 结构 。 
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| aj CD 结构 j- b) DVD 结构 
图 3-49 CD 5 DVD 结构 


DVD 使 用 的 底层 编码 为 8 一 16 位 编码 而 不 是 CD 使 用 的 8 ~ 14 位 编码 。DVD 格式 实 
际 上 更 有 效 ， 因 为 通过 从 65536 个 模式 中 选择 256 个 模式 , 可 以 在 记录 的 数据 中 避免 直流 分 
量 ， 且 不 再 需要 3 个 合并 位 。 因 此 ， 每 个 字 节 只 需要 16 位 而 CD 需要 17 位 。 

先 做 一 张 DVD， 其 0.6mm 的 厚度 比 CD 薄 一 半 。 再 做 第 二 张 盘 ， 也 是 0.6mm 厚 ， 两 张 
盘 捆 绑 在 一 起 组 成 最 终 的 DVD。 该 DVD 有 两 个 0.6mm 的 层 ， 其 中 一 层 为 DVD RAB, A 
一 层 为 空 或 虚拟 层 。 此 外 ， 可 以 在 同一 张 盘 片 上 具有 两 个 不 同 的 数据 层 。DVD 支持 图 3-50 
所 示 的 以 下 4 种 基本 格式 。 
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图 3-50 多 层 多 面 DVD 结构 

e DVD-5 为 单 面 单 层 盘 。 总 容量 4.7GB。 

e DVD-9 为 单 面 双 层 盘 。 总 容量 8.5GB。 

e DVD-10 为 双 面 单 层 盘 。 总 容量 9.4GB。 

e DVD-18 为 双 面 双 层 盘 。 总 容量 17.0GB。 

可 记录 DVD | 

可 记录 DVD 随 着 DVD 的 发 展 而 发 展 ， 就 像 CD 跟着 CD-ROM 的 发 展 一 样 。 然 而 ， 
DVD 技术 并 不 像 CD 技术 那样 迅速 稳定 下 来 ，CD、CD-R 和 CD-RW 依次 出 现 并 具有 合理 
的 向 后 兼容 性 。 几 年 之 内 ,DVD 后 出 现 了 DVD-RAM、DVD-RW、DVD+RW 和 DVD-R。 

DVD-R 是 一 次 写 的 介质 , 其 容量 为 4.7GB 或 9.4GB， 可 以 在 大 多 数 兼 容 的 DVD 驱动 
器 中 使 用 。 它 首 次 出 现在 1997 年 ， 是 一 种 低 容量 的 3:95GB 版 本 。1998 年 ， 出 现 了 第 一 
种 可 重 写 的 设备 称 为 DVD-RAM， 它 依赖 相 变 和 磁 光 技术 向 光盘 写 人 人 数据。 第 一 代 DVD- 
RAM 具有 2GB 的 容量 ,但 到 1999 年 增加 到 4.7GB。 该 系统 与 其 他 DVD 格式 不 兼容 。 

Pioneer 研发 了 DVD-RW 系统 ， 其 目标 是 创建 与 DVD 和 DVD-R 兼容 的 格式 。 这 种 格 
式 ， 首 先 出 现在 1999 年 ， 使 用 相 变 技术 来 读 、 写 和 擦 除 信 息 。650nm 波长 的 激光 加 热 相 变 
合金 晶体 使 其 从 晶 态 转变 为 非 晶 态 ,这 与 CD-RW 系统 完全 二 样 。 另 一 种 可 重 写 的 DVD 出 
现在 2002 年 ， 被 命名 为 DVD+RW 格式 。 它 自称 比 其 竞争 对 手 DVD-RW 更 加 兼容 。 
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3.7.6 Tit 


就 像 DVD 取代 CD 一 样 ， 蓝 光 技 术 正 在 取代 DVD。 蓝 光 的 引入 受 高 清 电视 Chigh 
defined television, HDTV) IKZ, HDTV 需要 比 DVD 提供 更 大 的 容量 。 没 有 新 的 存储 介 
质 ， 高 清 家 庭 影院 是 不 可 能 的 〈 不 考虑 有 线 广播 这 种 情况 )。 针 对 提高 光 记录 介质 容量 的 问 
题 提出 了 两 种 不 同 的 解决 方案 : HD DVD 和 蓝光 。 两 种 系统 都 在 发 展 ， 每 种 技术 背后 都 有 
媒体 巨头 的 支持 。 蓝 光 由 Sony、Panasonic、Philips LG. Pioneer 和 Apple 倡导 。HD DVD 
FH Toshiba, Hitachi, Microsoft 和 NEC 倡导 。 

这 两 种 不 兼容 的 格式 似乎 是 关于 VCR 录影 带 的 VHS All Betamax 标准 在 几 十 年 前 争斗 
的 一 种 回声 。 两 种 格式 迫使 消费 者 做 出 选择 并 使 商店 使 用 某 一 种 格式 存储 电影 。 最 终 ， 大 
制 片 厂 在 标准 大 战 中 具有 更 强 的 讨价还价 的 能 力 。Sony Picture, MGM, Disney 和 20th 
Century Fox 等 制 片 厂 选 择 了 蓝光 ， 只 有 Universal Studio ( 约 占 9% 的 市 场 份额 ) 选择 了 HD 
DVD. Sony 为 其 流行 的 PlayStation 3 游戏 机 ( 仅 在 美国 就 有 320 万 台 游 戏 机 ) 选择 了 蓝光 
以 增加 蓝光 产品 的 需求 。HD DVD 的 男 一 个 葬送 者 是 沃尔玛 的 促销 。 因 此 ， 蓝 光 胜 利 并 开始 
流行 了 ， 世 界 避 免 了 一 场 持久 的 格式 大 战 。 

通过 使 用 波长 为 405nm 的 高 频 激 光 ， 蓝 光 可 以 达到 25GB 的 高 密度 存储 (CB DVD 的 
5.3 倍 ) 。 可 见 光 谱 从 -620nm (红色 ) 延伸 到 450nm (紫色 )， 这 意味 着 蓝光 激光 是 蓝 色 /紫色 
的 ， 故 而 得 名 。DVD 激光 波长 为 650nm (红色 )，CD 激光 波长 为 780nm， 为 红外 光谱 。 蓝 
光 光 盘 与 CD 和 DVD 不 同 ， 因 为 蓝光 的 数据 层 位 于 仅 有 0.1mm 的 封面 保护 层 下 方 。 在 蓝光 
系统 中 聚焦 光束 使 用 镜头 的 数值 孔径 (0.85) 要 高 于 DVD (0.6) 和 CD (0.45 )。 回 忆 前 面 
介绍 的 ， 高 数值 孔径 允许 更 小 的 光 点 尺寸 。 

像 DVD 一 样 ， 蓝 光 支 持 双 层 结构 ， 可 以 提供 50GB 的 容量 。 图 3-51 提供 了 三 代 记 录 介 
质 的 图 像 来 展示 它们 的 相对 密度 。 
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图 3-51 三 代 记 录 光 盘 的 扫描 电镜 图 像 


蓝光 和 DVD 之 间 的 显著 区 别 是 盘 片 的 结构 和 记录 层 的 位 置 。 在 DVD 中 ， 数 据 记 录 层 
KERAHE ( CD 的 数据 记录 层 位 于 其 底部 )o 在 蓝光 介质 中 ,数据 记录 层 在 1.1mmi 厚 衬 
底 的 顶部 且 被 0.1mm 厚 的 保护 层 覆 盖 。 将 数据 层 放 在 盘 片 顶部 附近 的 好 处 是 增加 了 盘 片 对 
倾斜 (tilt) 的 容忍 。 并 不 是 所 有 的 盘 片 都 是 完全 平坦 的 “( 即 对 激光 来 说 是 正常 的 )， 所 以 会 有 
一 定 程度 的 倾斜 。 蓝 光 光 盘 能 够 容忍 的 倾斜 角度 上 限 为 0.64" 。 

DVD 通过 两 个 盘 片 来 生产 ， 将 数据 层 放 在 一 个 盘 片 上 然后 将 其 夹 在 两 个 盘 片 中 间 。 蓝 
光 光 盘 更 容易 制造 ， 因 为 数据 层 放 在 盘 片 项 部 然后 加 上 一 个 保护 层 。 该 保护 层 比 CD 和 
DVD 的 聚 碳酸 酯 衬 底 更 加 坚硬 ， 更 好 地 防止 光 磨 损 (light abrasion)。 现 代 蓝 光 光 盘 可 能 具 
有 复杂 的 涂 层 结构 。 例 如 ，Verbatim 盘 在 数据 层 上 具有 硬 模 层 、 和 覆盖 层 和 保护 层 。 在 数据 层 
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的 下 方 还 有 另外 的 保护 层 、 反 射 层 ， 然 后 才 是 聚 碳酸 酯 衬 底 。 


本 章 小 结 

本 章 介 绍 了 二 级 存储 系统 。 这 些 系统 能 够 以 非常 低 的 成 本 保存 海量 的 数据 。 不 幸 的 是 ， 
二 级 存储 系统 的 访问 时 间 比 半导体 存储 器 的 要 长 10° 量 级 ， 这 意味 着 计算 机 必须 使 用 有 效 的 
内 存 管理 系统 来 隐藏 二 级 存储 设备 的 延迟 。 一 些 二 级 存储 的 容量 在 以 令 人 震惊 的 速度 增长 ， 
在 21 世纪 初 达到 每 年 增长 60% 左右 。 虽 然 二 级 存储 系统 的 速度 经 过 了 多 年 的 改进 ， 但 其 访 
问 时 间 缩 短 得 很 慢 ,， 除 非 有 技术 上 的 根本 性 改变 ,人 们 不 太 可 能 看 到 任何 真正 的 进展 。 

主要 的 二 级 存储 技术 为 磁 存 储 和 光 存 储 。 这 些 技术 都 占据 着 计算 机 世界 中 的 一 席 之 地 。 
磁 存 储 比 光 存储 提供 了 更 好 的 访问 时 间 、 更 大 的 容量 以 及 更 好 的 读 / 写 性 能 。 这 些 特点 使 得 
磁 存 储 对 于 计算 机 运行 时 存储 程序 和 数据 的 驱动 器 来 说 十 分 理想 。 光 存储 系统 提供 低 成 本 的 
移动 存储 介质 ,主要 包括 CD ( 600MB)、DVD ( 约 4.7GB) 和 蓝光 (25GB). 

本 章 也 介绍 了 如 何 使 用 硬盘 来 构建 低 成 本 、 大 容量 存储 系统 RAID， 它 比 单个 硬盘 具有 
更 高 的 可 靠 性 和 更 好 的 性 能 。 本 章 还 引入 了 固态 盘 技 术 ， 它 正在 取代 旋转 的 磁盘 驱动 器 ， 但 
也 具有 其 自身 的 局 限 性 。 

磁 存 储 是 一 种 成 熟 的 技术 。 主 要 在 磁盘 容量 和 接口 方面 进行 不 断 更 新 。 光 存储 目前 正 处 
于 蓝光 技术 取代 DVD 和 CD 的 阶段 。 然 而 ， 光 技术 的 进步 并 不 是 主要 由 PC 世界 驱动 ， 而 
是 由 好 莱 坞 和 其 他 电影 制 片 方 推动 ， 因 为 它 主要 是 作为 存储 音像 制品 的 载体 。 


习题 

3.1 是 什么 限制 了 硬盘 的 面 密 度 ? 

3.2 本 章 参 考 了 2000 年 12 月 在 《IEEE Spectrum 》 上 发 表 的 一 篇 关于 磁 存 储 的 论文 ,标题 为 
“Magnetic Storage: The medium that wouldn’t die ”。 该 标题 暗示 磁 存 储 技术 应 该 早 就 过 时 了 。 请 解 
释 为 什么 许多 人 这 么 认为 ， 但 磁 存 储 技 术 却 继续 范 壮 成 长 。 

3.3 解释 下 列 用 于 磁 存 储 技术 的 术语 。 
a. 磁场 Peto: ic eae c. 磁 致 伸缩 da RRA 
e: 铁 磁体 f. JERA g. 硬 磁 存储 h. 软 磁 存 储 

3.4 硬盘 设计 师 面临 的 主要 障碍 是 什么 ? 为 笔记 本 电脑 和 便携 式 计算 机 制造 硬盘 导致 工程 师 需要 一 组 
不 同 的 设计 标准 。 移 动 硬 盘 设 计 师 需要 特别 的 考虑 是 什么 ? 

3.5 硬盘 驱动 器 曾经 使 用 组 合 的 感应 式 读 写 磁头 今天 ,高 性 能 驱动 器 使 用 GMR 读 磁头 。 什 么 是 
GMR 读 磁头 ? 将 读 写 磁头 分 离 的 优势 是 什么 ? 

3.6 为 什么 难以 从 如 磁带 或 磁盘 这 样 的 磁 介 质 中 完全 擦 除数 据 ? 为 什么 数据 在 被 写 人 磁盘 之 前 要 进行 
编码 ? À 

3.7 下 面 的 数据 序列 是 在 磁盘 中 记录 的 MFM 编码 。 画 出 写 磁头 看 到 的 结果 波形 。 
0101001100001111 i 

3.8- 决 定 扇 区 最 佳 大 小 的 标准 是 什么 ? 这 些 标 准 是 永 秋 不 变 的 还 是 会 随时 间 变 化 ? 在 计算 世界 中 哪些 
发 展 可 能 会 影响 这 个 问题 的 答案 ? 

3.9 硬盘 驱动 器 的 道 密度 为 524.000tpi， 面 密度 为 29:7Gb/in 。 磁 道上 的 位 密度 是 多 少 ? 

3.10 假设 某 磁盘 驱动 器 有 以 下 参数 。 短 寻 道 的 时 间 为 1+0.2 nms, 长 寻 道 的 时 间 为 3+0.003nms。 假 

定 短 寻 道 小 于 200 条 磁道 。 假 设 驱动 器 顺序 访问 以 下 磁道 ， 所 需 的 近似 寻 道 时 间 (忽略 旋转 延迟 ) 
是 多 少 ? 
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2344, 2345, 2347, 2310, 1566, 1580, 2350, 2352, 1210, 3230 
CEE) 321 0 ROE OSU A As ES FE IS A UE EAE 寻 道 时 间 又 会 是 
多 少 ? 

如 何 使 磁盘 驱动 器 更 快 ( 即 制 造 商 可 以 有 哪些 选项 )? 

某 硬盘 具有 以 下 参数 : 6 面 ， 每 面 2 万 条 磁道 ， 每 条 磁道 256 NAK, BANE 512 字 蔬 ; 转速 
为 7200r/min。' 计 算 : 磁盘 的 容量 、 旋 转 延 迟 、 定 位 肩 区 后 读 取 数据 的 速率 。 

描述 以 下 磁头 调度 算法 :"FIFO SSTF、SCAN 和 有 €=SEAN。 

某 制 造 商 希望 生产 旋转 延迟 为 1ms 的 磁盘 ,需要 的 转速 是 多 少 ? 

某 磁 盘 驱动 器 具有 以 下 特性 : 转速 为 7200r/min ; 每 条 磁道 256 个 扇 区 ; 寻 道 间距 小 于 10 条 磁道 
时 跨越 每 条 磁道 的 时 间 为 2ms ; 寻 道 间距 小 于 20 条 磁道 时 跨越 每 条 磁道 的 时 间 为 Ims; 寻 道 间 
距 小 于 40 条 磁道 时 跨越 每 条 磁道 的 时 间 为 0.4ms。 假 定 后 续 扇 区 与 当前 扇 区 位 于 同一 条 磁道 时 
不 需要 寻 道 ， 要 访问 以 下 扇 区 所 需 的 近似 时 间 为 多 少 ” 每 一 对 数据 中 前 者 表示 磁道 号 ， 后 者 表示 
AKS, 

(10,16), (10,38), (10,50), (10,51), (11,101), (9,119), (24,36), (24,35), (198,40) 

SMART 技术 是 什么 ， 它 是 如 何 帮助 硬盘 用 户 的 ? 

最 流行 ( 即 商业 上 最 成 功 ) 的 RAID X RAID 1 和 RAID 5， 为 什么 ? 

假设 磁盘 驱动 器 有 5000 个 柱 面 ， 编 号 为 0 ~ 4999。 驱 动 器 当前 正在 服务 对 143 号 柱 面 的 请 求 ， 
前 一 个 请 求 是 柱 面 125。 以 FIFO 排队 的 请 求 顺序 为 : 86. 1470, 913, 1774, 948, 1509, 1022, 
1750 和 130。 从 当前 磁头 位 置 开 始 ， 按 照 以 下 磁盘 调度 算法 ， 磁 臂 完成 这 些 请 求 需 要 移动 的 总 距 
离 (以 柱 面 表示 ) 是 多 少 ? 

a. FCFS; b. SSTF; c. SCAN 

如 果 单 个 驱动 器 失效 的 概率 是 每 1000 小 时 0.000 001 次 ， 由 4 个 磁盘 组 成 的 阵列 中 只 有 一 个 磁盘 
失效 的 概率 是 多 少 ? 两 个 磁盘 一 组 ， 由 4 组 构成 的 阵列 中 只 有 一 个 磁盘 失效 的 概率 是 多 少 ? 

当 计算 类 似 RAID 这 样 有 多 个 磁盘 的 系统 的 可 靠 性 时 ， 概 念 上 显然 有 ， 单 个 磁盘 失效 的 概率 为 
1/1000， 则 两 个 磁盘 失效 的 概率 为 /100 万 ， 这 是 由 于 不 相关 的 概率 相 乘 的 结果 。 为 什么 说 这 种 
说 法 可 能 是 错误 的 ? 

为 什么 没有 RAID 系统 采用 光 存 储 ? 

为 什么 CD 对 尺寸 比 盘 片上 存储 位 大 很 多 的 污染 物 颗粒 的 影响 相对 不 敏感 ? 为 什么 需要 激光 器 将 
光盘 上 的 数据 读 出 ? 

为 什么 在 将 数据 位 记录 到 CD 之 前 需要 进行 类 似 8 ~ 14 位 这 样 的 编码 ? 

如 果 激 光 的 波长 为 780nm， 数 值 孔径 为 0.45， 照 在 CD 表面 光 点 的 大 小 是 多 少 ? 

恒 角 速度 和 恒 线 速度 的 区 别 是 什么 ? 为 什么 一 种 用 于 磁盘 而 另 一 种 用 于 光盘 ? 

磁盘 转速 为 7200r/min， 磁头 位 于 离 盘 片 中 心 2in 的 磁道 上 ， 相 应 的 线 速度 和 角速度 为 多 少 ? 

可 写 CD 是 如 何 实现 的 ? 

WFR 20 世纪 80 年 代 前 的 磁带 为 1/2in 宽 ， 在 9 条 磁道 上 以 128 字符 /in 的 密度 记录 数据 ， 用 位 
表示 的 磁带 每 平方 英寸 的 面 密度 是 多 少 ? 该 面 密度 与 现代 磁盘 面 密度 的 比例 为 多 少 ? 

1996 年 ，NEC 发 布 了 64MB 的 闪存 ， 蕊 片 尺寸 为 98mm”。 用 b/i 表示 的 话 ， 相 应 的 面 密度 为 
多 少 ? 

到 2002 年 , 已 经 有 了 尺寸 为 125mm*、 容 量 为 1Gb 的 闪存 。 用 byin? 表示 的 话 ， 相 应 的 面 密度 为 
多 少 ? 

2010 年 9 H, Toshiba 发 布 了 第 一 款 咎 入 式 闪 存 模块 ( 即 散 入 电路 板 而 非 直 插 模块 )。 这 些 模块 的 
容量 为 128GB，FBGA 封装 尺寸 为 17mm x 22mm x 1.4mm。 用 b/in? 表示 的 话 ， 相 应 的 面 密度 为 
多 少 ? 

车 将 问题 3.32 中 的 奉 入 式 闪 存 模块 制 成 标准 的 3.5 英寸 磁盘 驱动 器 ， 假 定 一 半 的 体积 要 用 于 散热 
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和 接口 电路 ， 该 驱动 器 可 存储 的 数据 量 为 多 少 ? 

3.34 如 果 蓝 光 激光 的 波长 为 405nm， 物 镜 的 数值 孔径 为 0.85， 蓝 光 激 光 的 最 小 光 点 大 小 是 多 少 ? 

3.35 WR DVD 激光 的 波长 为 650nm， 物 镜头 的 数值 孔径 为 0.6，DVD 激光 的 最 小 光 点 大 小 是 多 少 ? 

3.36 假定 一 个 光 点 可 以 烧 出 一 个 1 或 0， 激 光 的 波长 为 405nm， 物 镜 的 数值 孔径 为 0:85，, 光 道内 径 和 
外 径 分 别 为 23mm 和 59mm， 计 算 单 层 蓝 光 光 盘 的 理论 最 大 容量 。 

3.37 对 比 闪 存 和 硬盘 的 优点 和 不 足 ? 什么 是 耗损 平衡 ， 为 什么 要 在 闪存 中 使 用 它 ? 

3.38 某 硬盘 由 线性 膨胀 系数 为 1.5 x 10° CHM EHS 磁道 间距 为 1000nm。 假定 磁头 精确 定位 于 半 
径 为 2in 的 磁道 上 方 ， 磁 头 偏离 磁道 20% 将 使 错误 率 增加 。 该 磁盘 可 以 忍 pe 
度 ? 从 答案 中 可 以 得 到 什么 结论 ? 
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“我 应 该 是 个 竞争 者 。” 
一 一 Marlon Brando,《 码 头 风云 》 


“永远 不 要 把 编译 时 该 做 的 事情 推迟 到 运行 时 。” 


—David Gries 


“任何 人 都 可 以 制造 快速 的 CPU。 关 键 是 如 何 制 造 快速 的 系统 。” 


—Seymour Cray 


“这 虽 是 疯 话 ， 却 有 深意 在 内 。” 





莎士比亚 ,《 哈 姆 雷 特 》 


“ZE— RG, 则 Beinn” 
一 一 罗马 法 律 条 文 


“除了 死亡 、 税 收 , 没有 什么 是 必然 的 5 今天; USB 显然 在 不 断 取 得 成 功 a” 
ae ——Cheryl Coupé 


在 计算 机 可 以 处 理 和 存储 信息 之 前 ， 它 们 必须 从 外 部 世界 读 取 数 据 。 同 样 ， 计 算 机 必须 
能 够 将 信息 传输 给 外 部 设备 。 接 下 来 将 介绍 数据 是 如 何 进 入 和 移出 计算 机 的 ， 以 及 这 些 数据 
是 如 何 通 过 总 线 家 族 (family of bus) 在 计算 机 各 功能 部 件 之 间 进 行 传输 的 。 

计算 机 不 只 是 一 整 块 硅 片 ， 它 由 互相 连接 的 子 系统 构成 ， 例 如 存储 器 阵列 、 磁 盘 驱 动 
器 、 视 频 显 示 系 统 以 及 一 个 或 多 个 处 理 器 。 每 个 子 系统 执行 特定 的 任务 并 与 计算 机 中 其 他 子 
系统 进行 通信 。 本 书 关注 的 是 内 部 子 系统 之 间 以 及 系统 与 外 部 之 间 是 如 何 进行 通信 的 。 从 
IO 是 不 是 计算 机 体系 结构 或 计算 机 组 成 的 一 部 分 这 个 问题 开始 。 IO 基本 上 属于 计算 机 组 
成 ( organization) 的 范畴 ， 因 为 它 关心 的 是 数据 如 何 从 一 个 地 方 传 输 到 另 二 个 地 方 。 一 些 计 
算 机 体系 结构 的 教材 集中 讨论 处 理 器 ISA 的 细节 或 处 理 器 内 部 的 组 织 ， 对 总 线 和 了 IO 讨论 较 
少 。 本 章 将 更 深入 地 研究 IO， 因为 它 对 系统 性 能 的 贡献 与 CPU 一 样 重要 。 此 外 ,， 对 IO 的 
研究 还 包括 了 理解 数字 系统 必 不 可 少 的 重要 主题 (例如 ， 缓 冲 、 握 手 以 及 协议 )。 

本 章 首先 概述 了 IO 操作 和 数据 从 一 个 位 置 移动 到 另 一 个 位 置 的 方式 。 然 后 考察 了 
M PCI 总 线 到 USB 接口 的 1/0 系统 。4.1 节 介绍 计算 机 是 如 何 处 理 1/O 事务 的 。 使 用 事务 
(transaction) 这 个 术语 是 因为 VO 包括 处 理 器 与 输入 /输出 设备 之 间 的 对 话 。 

本 章 的 主题 主要 是 总 线 (bus), 数据 利用 它 在 计算 机 内 部 以 及 计算 机 与 其 外 围 设备 之 间 
进行 移动 。 如 果 连 接 CPU 和 存储 器 的 总 线 不 能 以 CPU 所 需 的 速度 提供 数据 ， 将 CPU 和 存 
储 器 做 得 再 快 也 没有 意义 。 现 代 个 人 计算 机 的 发 展 归功 于 处 理 器 的 发 展 ; -也 同样 归功 于 总 线 
技术 的 发 展 。 人 们 喜欢 性 能 ， 但 其 购买 的 是 各 种 功能 。 事 实 是 ， 用 户 可 以 将 计算 机 与 互联 
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网 、 数 码 相 机 、 多 个 打印 机 、 扫 描 仪 、MP3 播放 器 以 及 iPad 相连 接 ， 使 个 人 计算 机 如 此 值 
得 拥有 。 如 果 用 户 不 能 轻易 地 通过 一 条 或 多 条 总 线 将 计算 机 连接 到 以 上 所 有 这 些 外 部 系统 的 
话 ， 它 将 永远 只 是 一 台 文字 处 理 器 、 数 据 库 引擎 或 者 游戏 机 。 

今天 ， 人 们 把 总 线 说 成 是 一 种 体系 结构 和 系统 基础 设施 ， 这 是 因为 总 线 不 再 是 将 计算 机 
内 两 个 或 多 个 部 分 联系 在 一 起 的 简单 信号 通路 。 多 年 来 ， 总 线 不 断 地 发 展 ， 提 供 了 比 以 前 更 
多 的 功能 。 例 如 ， 在 多 处 理 环境 中 ， 总 线 不 得 不 应 对 多 个 CU。 此外， 现代 高 性 能 计算 机 
系统 不 止 一 条 总 线 ; 它 有 层次 化 总 线 一 一 每 条 总 线 都 为 特定 的 目的 进行 了 优化 。 一 些 总 线 在 
CPU 和 随机 存 取 存 储 器 之 间 提 供 高 速 数据 传输 ， 而 其 他 总 线 以 更 慢 的 速率 、 更 长 的 路 径 向 
打印 机 和 调制 解 调 器 发 送 数据 。 


4.1 10 的 基本 原理 


下 面 介绍 VO 事务 的 基本 原理 与 相关 词汇 。 图 4-1 描述 了 一 个 通用 的 计算 机 系统 ， 它 具 
有 CPU, W/O 控制 器 、 外 围 设 备 ， 以 及 将 CPU 与 存储 器 和 外 围 设备 连接 在 一 起 的 系统 总 线 。 
在 图 4-1 中 外 围 ( peripheral) 一 词 出 现 了 两 次 ， 它 既 用 来 描述 外 部 设备 〈 如 连接 到 计算 机 的 
打印 机 或 鼠标 )， 又 描述 外 部 设备 与 CPU 之 间 的 接口 。 





| 一 外 围 设备 
总 线 主 设备 总 线 从 设备 







外 围 设备 控制 器 


(或 接口 ) 
| a 
2 
地 址 、 数据 和 /一 学 | 
控制 信号 n e ° 


图 4-1” 处 理 器 、 总 线 与 IO 系统 


图 4-2 从 另 一 个 角度 来 观察 计算 机 系统 的 层次 结构 :CPU 和 存储 器 位 于 系统 的 核心 。 将 
处 理 器 和 存储 器 连接 到 外 部 设备 的 外 围 接 口 ( peripheral interface) 显示 在 两 个 框 中 ; 一 个 包 
含 内 部 《internal) 外 设 (如 磁盘 驱动 器 ), 一 个 包含 外 部 (external) 外 设 ; (例如 调制 解 调 器 、 
打印 机 和 扫描 仪 )。 内 部 外 设 和 外 部 外 设 没 有 根本 的 区 别 。 

TO 控制 器 可 以 被 认为 就 是 一 种 协议 转换 器 (protocol converter)， 因 为 它 既 符合 计算 机 
总 线 协议 的 需要 ， 也 满足 外 部 外 围 设 备 协议 的 需要 。 它 可 以 进行 不 同 数据 格式 之 间 的 转换 
(例如 改变 电压 水 平 ， 对 信号 进行 编码 ;将 并 行 数据 转换 为 串 行 数据 ， 等 等 )。1/O 控制 器 的 
复杂 性 可 以 和 CPU 的 复杂 性 相 匹 敌 。 

一 些 计算 机 使 用 特殊 的 机 器 指令 和 控制 信号 来 处 理 IO 事务 。 例 如 ;一 个 假想 的 微 处 理 
器 可 能 通过 以 下 指令 将 寄存 器 r3 中 的 一 个 字 节 发 送 给 称 为 通道 5 的 磁盘 驱动 器 : 


OUTPUT r3,Chan5 - ;通过 通道 5 将 r3 中 的 数据 发 送 到 磁盘 
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CPU 


总 线 家 族 


计算 机 系统 
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4-2 ”计算 机 系统 的 层次 


Intel 处 理 器 的 指令 集中 有 一 组 IO 指令 ， 人 允许 8080 和 8086 系列 成 员 之 间 通 过 寄存 器 和 
8 位 的 端口 传输 数据 。 例 如 ， 指 令 IN AL, acn 将 端口 地 址 为 4Cie 的 一 个 字 节 传输 至 寄存 器 
AL， 指 令 our 48H, aL 将 寄存 器 AL 中 的 一 个 字 节 传输 至 端口 地 址 4E16。 处 理 器 产生 控制 信 
号 , (EVO 控制 器 可 以 检测 到 访问 。 因 为 没有 必要 ， 所 以 很 少 有 微 处 理 器 采用 这 种 方法 。 

具有 专用 VO 指令 的 处 理 器 使 用 地 址 总 线 来 定义 数据 端口 ， 在 写 周 期 中 通过 该 端口 发 送 
数据 ， 在 读 周期 中 通过 该 端口 获得 数据 。 这 种 处 理 器 被 认为 既 具 有 存储 空间 (memory space) 
MAA VO 空间 (IO space)。 专 用 IO 体系 结构 ， 例 如 8080 结构 ， 需 要 特定 的 硬件 并 消耗 
了 指令 空间 (每 条 执行 IO 操作 的 指令 本 可 以 做 其 他 事情 )。 

存储 器 映射 的 外 围 设备 

微 处 理 器 可 以 不 需要 O 功能 ， 因 为 IO 事务 和 存储 器 访问 没有 本 质 区 别 。 在 处 理 器 看 
来 ， 向 外 围 设备 输出 一 个 字 与 在 存储 器 中 存储 一 个 字 完 全 相同 ， 而 从 外 围 设 备 获取 一 个 字 与 
从 存储 器 中 读 取 一 个 字 也 完全 相同 。 将 IO 事务 看 作 存 储 器 访问 被 称 为 存储 器 映射 (memory 
mapped) 的 TO。 该 方式 可 以 像 访问 存储 器 那样 访问 UJO， 但 这 并 不 意味 着 可 以 忽略 TO， 因 
为 随机 访问 存储 器 的 性 质 与 典型 的 1/O 系统 的 性 质 完 全 不 同 。 当 实现 VO 结构 时 ， 必 须 考 虑 
IO 设备 本 身 的 特点 。 例 如 ， 当 向 磁盘 驱动 器 写 人 一 个 文件 时 ， 可 能 会 每 隔 几 ps 就 发 送 一 个 
新 的 数据 字 节 。 图 4-3 显示 了 典型 的 存储 器 映射 IO 端口 (外围 接口 芯片 ) 看 起 来 与 处 理 器 
非常 相像 。 

对 于 主机 CPU 来 说 ， 外 围 设 备 看 上 去 就 像 连续 的 存储 器 地 址 ， 如 图 4-4 所 示 。 图 4-3 
中 外 围 接口 芯片 左手 边 部 分 在 CPU 看 起 来 完全 像 一 个 存储 器 部 件 。 外 围 接口 芯片 的 另 一 半 ， 
即 右手 边 部 分 是 执行 接口 所 需 特定 操作 的 外 围 端 ( peripheral side). 例如 ”磁盘 控制 器 接 日 
可 能 需要 寻找 特定 的 扇 区 ,或 者 串 行 接口 芯片 可 能 把 一 个 字 节 转换 成 可 以 通过 单 根 信号 线 传 
输 的 脉冲 序列 。 外 围 接口 芯片 与 适当 的 外 围 设备 (例如 ， 磁 盘 驱 动 器 、 鼠 标 、 键 盘 或 打印 机 ) 
连接 。 
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CPU 对 应 部 分 外 围 对 应 部 分 
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“oun See 
图 4-3 处 理 器 、 端 口 与 外 围 
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图 4-4 存储 器 映射 的 寄存 器 


图 4-4. 中 的 存储 器 映射 端口 具有 连续 的 4 个 寄存 器 ， 其 地 址 为 i、i+t1、i+2 和 i+3。 假 
定 外 围 设备 为 8 位 的 设备 ， 每 个 连续 的 地 址 对 应 一 个 字 节 。 在 具有 32 位 数据 总 线 的 系统 中 ， 
寄存 器 的 地 址 将 为 i、i+4、.it8 和 计 12。 地 址 i 处 包含 一 个 命令 寄存 器 ， 它 定义 了 操作 模式 
和 外 围 设备 的 特性 。 大 多 数 存储 器 映射 MO 端口 根据 特定 的 应 用 被 配置 成 可 以 执行 多 种 模式 
的 操作 。 通 过 提供 多 功能 的 IO 设备 ， 半 导体 制造 商 使 用 单个 芯片 就 可 以 覆盖 大 部 分 的 市 场 
需求 。 

第 二 个 位 置 为 地 址 计 1， 包含 了 端口 的 状态 ， 它 由 相应 的 外 围 设备 设置 。 处 理 器 可 以 读 
取 状 态 信 息 来 确定 参加 数据 事务 处 理 的 端口 是 否 已 经 准备 就 绪 ， 或 者 是 否 发 生 了 错误 。 例 
如 ， 连 接 到 存储 器 映射 IO 端口 的 打印 机 需要 设置 错误 位 来 表示 打印 纸 用 完了 。 在 图 4-4 的 
这 个 例子 中 ,构建 了 通用 的 状态 位 9 ， 例 如 ERR。,,、ERR;,、RDY,,, 和 RDY,, (分 别 表示 输出 
错误 、 输 入 错误 :输出 就 绪 和 输入 就 绪 )。 


i (2 E NO Bee 
说 明了 自动 清除 机 制 可 能 结构 。 当 外 国 3 
使 发 器 F 人 















F 


O 在 条 件 码 寄存 器 中 ， 每 位 状态 位 通常 指 的 就 是 一 个 状态 标志 位 。 
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Peno 
ule 。 当 处 理 器 读 取 状 ? 
来 自 外 围 设备 后 ; 它 被 自动 清除 
的 状态 标志 





将 时 钟 数 据 输 
和 人 状态 寄存 器 


当 处 理 器 访问 
该 端口 表示 “该 " 
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处 理 器 数据 总 线 | 

处 理 器 通过 生成 适当 的 存储 器 映射 端口 的 地 址 来 读 取 FFI 的 状态 。 有 效 的 地 址 将 三 

态 门 使 能 ， 并 将 Q 的 输出 放 到 处 理 器 可 以 读 取 的 数据 总 线 的 一 根 信号 线 上 。 读 信号 同 
时 还 在 下 个 时 钟 的 下 降 沿 将 触发 器 FF2 置 位 。 

FF2 的 输出 Q, 与 FF3 的 输入 Di 连接 在 一 起 ， 使 得 Q;: 将 在 下 个 时 钟 的 上 上升 油 有 效 。 

由 于 FF3 的 输出 连接 到 触发 器 FF1 复位 (CLR) 信号 的 输入 ， 当 Qi 为 高 电 平 有 效 时 状 

当 读 信 号 变 低 时 ， 和 触发 器 FF2 和 FF3 回 到 其 正常 的 低 电 平 不 活动 状 


态 ，CLR 信号 从 FFI EHR. 
下 图 给 出 了 该 电路 的 时 序 图 。 自 动 清除 电路 必须 谨慎 使 用 ， 因为 不 经 意 的 读 操作 就 
SOR IE SSR oI Te Ae ae OE aA TE Po 例如 ， 某 些 处 理 器 在 
访问 地 址 1 的 时 候 向 地 址 1+1 进行 了 虚拟 访问 。 





地 址 i+2 和 计 3 分 别 用 来 保存 向 外 围 设备 输出 以 及 从 外 围 设 备 接收 的 数据 。 正 是 通过 这 
些 地 址 ， 处 理 器 可 以 实现 与 IO 端口 的 通信 。 

一 些 外 围 设备 具有 可 以 自动 清除 的 状态 标志 位 ; 假设 某 个 标志 位 ,通过 IO 事件 
(event) (例如 数据 就 绪 、 设 备 忙 或 者 数据 错误 ) 置 位 。 一 旦 读 取 该 标志 后 ， 虽 然 可 以 手动 
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清除 ， 但 更 好 的 方法 是 在 标志 位 被 读 取 后 就 自动 清除 。 前 面 已 解释 了 自动 清除 标志 位 的 
逻辑 。 


4.1.1 外 围 设备 寄存 器 寻 址 机 制 


并 不 是 所 有 的 外 围 接口 设备 都 采用 图 4-4 这 种 具有 单独 的 可 寻 址 寄存 器 的 寻 址 模式 。 我 
们 可 以 发 现 ， 命 令 寄存 器 和 向 外 围 设 备 输出 数据 的 寄存 器 是 只 写 的 ， 而 状态 寄存 器 和 来 自 外 
围 设备 输入 数据 的 寄存 器 是 只 读 的 。 因 此 ， 一 根 的 地 址 线 就 可 以 区 分 这 两 对 寄存 器 ( 即 ， 是 
命令 寄存 器 还 是 状态 寄存 器 ， 以 及 是 数据 输入 还 是 输出 数据 )。 在 这 种 情况 下 ， 处 理 器 的 读 
和 写 信和 号 可 以 完成 只 读 与 只 写 寄存 器 的 区 分 。 

表 4-1 给 出 了 这 种 寄存 器 寻 址 方案 。 外 围 设 ” 表 4-1 使 用 CPU RW 信号 输出 来 选 


备 提供 4 个 内 部 寄存 器 ， 但 是 处 理 器 只 能 看 到 两 择 寄存 器 

个 特定 的 位 置 ，N 和 N44。 在 这 种 情况 下 ，CPU 
的 R/W 信号 输出 用 于 选择 两 对 寄存 器 之 一 。 当 一， Pe |x | 
R/W-0 时 ， 只 写 寄存 器 被 选中 ， 当 RAW=1 时， ESTEE 





只 读 寄存 器 被 选中 。 图 4-5 强调 了 外 围 设 备 寄存 HE 
器 空间 被 分 为 只 读 和 只 写 区 域 的 方式 。 


有 些 计算 机 分 别 有 读 和 写 信 号 。 有 此 计算 机 只 有 一 个 RW (ik ERY MER: vad 
RAST, 在 号 操作 时 为 低 电 平 。 : 





CPU 空间 外 围 设备 空间 





an 
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neal j+2 





NK 


图 4-5 CPU 空间 和 寄存 器 空间 


读者 可 能 想 知道 为 什么 半导体 设计 师 试 图 减少 单独 的 可 寻 址 寄存 器 的 数量 。 原 因 很 简 
A, 访问 2" 个 寄存 器 需要 n 条 地 址 线 。 减 少 寄存 器 的 数量 意味 着 与 外 围 设备 连接 需要 更 少 
的 引 脚 。 芯 片 封装 和 引 脚 的 数量 对 芯片 的 成 本 有 重要 的 影响 。 

减少 分 配给 外 围 设备 的 可 寻 址 存储 器 位 置 数量 的 另 一 种 手段 与 指针 位 《pointer bit) 的 
使 用 有 关 。 假 设 外 围 设 备 中 的 两 个 或 多 个 读 / 写 寄存 器 在 共享 一 个 共同 的 地 址 (common 
address)。 通 过 使 用 另 一 个 寄存 器 中 的 一 位 作为 指针 (pointer)， 将 其 中 一 个 寄存 器 与 指针 位 
设置 为 0 关联， 而 另 一 个 与 指针 位 设置 为 1 关联， 这 样 就 可 以 区 分 具有 相同 地 址 的 两 个 寄 
存 器 。 

一 些 接口 具有 大 量 的 内 部 寄存 器 ， 提供 足够 的 地 址 线 来 单独 访问 每 个 寄存 器 可 能 非常 常 昂 
贵 。 可 以 使 用 两 个 可 寻 址 寄存 器 来 控制 所 有 的 内 部 访问 : 一 个 指针 寄存 器 pointer register) 
和 一 个 数据 寄存 器 。 程 序 员 通 过 向 指针 寄存 器 中 装载 所 需 寄 存 器 的 偏 移 ， 然 后 再 读 写 数据 寄 

存 器 来 实现 对 外 围 设备 内 部 寄存 器 的 访问 。 

l 这 种 技术 只 需要 一 根 地 址 线 来 区 分 内 部 寄存 器 ,但 会 造成 访问 速率 的 降低 。 在 外 围 设备 
内 部 实现 基于 指针 的 寻 址 方式 性 价 比 较 高 。 例 如 显示 控制 器 ， 其 配置 寄存 器 在 初始 化 后 就 很 
少 被 访问 。 


tA / Fir B 155 


基于 指针 寻 址 方式 的 一 种 变化 涉及 内 部 指针 对 自动 递增 (automatically incrementing) 的 
使 用 。 图 4-6 展示 了 使 用 计数 器 的 输出 来 寻 址 的 寄存 器 堆 。 外 围 接口 被 重 置 后 ， 内 部 指针 
( 即 计 数 器 ) 被 置 为 零 。 每 次 对 接口 的 访问 都 会 使 指针 的 内 容 递增 ， 因 此 将 顺序 选择 下 一 个 
寄存 器 。 当 总 是 顺序 访问 寄存 器 时 ， 外 围 设 备 具 有 自动 递增 指针 是 非常 有 用 的 。 例 如 ， 在 显 
示 控 制 器 中 ， 显 示 器 的 分 辩 率 、 水 平和 垂直 像素 计数 器 以 及 帧 速率 等 总 是 按照 严格 的 顺序 装 
载 至 寄存 器 中 。 






计数 器 在 每 次 访问 
的 基础 上 加 1 
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图 4-6 Ht A SET RIS hat Fa 


4.1.2 外围 设 备 访 问 和 总 线 宽度 


存储 器 映射 的 外 围 设备 需要 考虑 的 第 二 个 因素 是 外 围 设备 数据 总 线 宽度 与 主机 数据 总 线 
宽度 之 间 的 关系 。 许 多 外 围 设备 通过 8 位 宽度 的 总 线 连接 到 32 位 的 计算 机 。 

当 8 位 外 围 设备 通过 8 位 数据 总 线 与 8 位 处 理 器 连接 ,或 当 16 位 外 围 设备 通过 16 位 
数据 总 线 与 16 位 处 理 器 连接 ， 这 都 是 很 容易 的 。 当 低 成 本 的 8 位 外 围 设备 与 16 位 或 32 位 
的 总 线 相连 ,事情 就 变 得 复杂 。 将 8 位 外 围 设备 与 16 位 总 线 相连 会 出 现 两 个 问题 ， 存 储 端 
格式 (endianism) 问题 以 及 映射 问题 ， 即 如 何 将 8 位 寄存 器 映射 到 处 理 器 的 16 位 地 址 空间 。 
考虑 图 4-7 中 的 情形 ，8 位 外 围 设 备 与 16 位 总 线 相 连 。 外 围 设 备 只 与 一 半 的 总 线 数 据 线 连 
接 。 如 果 处 理 器 支持 真正 的 8 位 总 线 事务 ,一 切 OK， 寄 存 器 可 以 按照 其 字 节 地 址 访问 ( 字 
节 偏 移 量 为 0、1、2 和 3 )。 

如 果 处 理 器 只 支持 16 位 总 线 操作 ， 当 16 位 的 值 写 入 存储 器 ， 所 有 16 位 都 被 放 到 数据 
总 线 上 。 当 处 理 器 执行 字 节 访问 时 ， 它 执行 的 仍然 是 字 操 作 ， 但 是 需要 告诉 处 理 器 接口 或 存 
储 器 只 需要 传输 8 位 。 此 时 需要 单独 的 控制 或 地 址 信号 来 指定 访问 的 字 节 是 当前 地 址 的 高 位 
字 节 还 是 低位 字 节 。 

在 这 种 情况 下 ， 外 围 设备 被 连接 到 数据 总 线 的 一 半 ， 只 能 对 奇数 或 偶数 字 节 地 址 进行 响 
应 。 在 大 端 (big endian)- 环 境 中 ， 外 围 设备 应 被 连接 到 数据 线 [0:7] 并 访问 奇数 地 址 ， 而 在 
小 端 ( little endian) 环境 中 ， 外 围 设备 应 被 连接 到 数据 线 [8:15] 并 访问 偶数 地 址 。 外 围 设 备 
的 4 个 地 址 在 计算 机 看 来 其 字 节 偏 移 为 0、2、4 和 6。 

一 些 处 理 器 实现 了 某 些 专用 指令 用 于 与 具有 字 节 宽度 的 外 围 设 备 进 行 数 据 传输 操作 。 例 
如 ，32 位 的 68000 处 理 器 具有 mover 指令 (其 含义 为 移动 外 围 设备 )， 该 指令 可 以 从 8 位 存 
储 器 映射 的 外 围 设备 读 写 16 位 或 32 位 的 数据 。 图 4-8 显示 了 具有 4 个 内 部 寄存 器 的 外 围 设 
备 以 及 CPU 地 址 图 ， 其 中 外 围 设备 的 数据 空间 在 大 端 模 式 处 理 器 存储 器 空间 中 被 映射 到 连 
续 的 奇 地 址 。 
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连接 外 围 设备 
的 8 位 总 线 





由 于 外 围 设 备 与 
8 位 或 16 位 数据 总 字 节 3 | esi 
线 相 连 ， 其 字 节 位 
E E CPU GK 


是 连续 的 字 地 址 
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图 4-7 8 位 外 围 设备 与 16 位 总 线 


外 围 设 备 空间 














存储 空间 
高 位 字 节 ”低位 字 节 


n+l 
n+2 
n+3 
8 位 
a) 字 节 寻 址 的 外 围 设 备 。4 b) 大 端 模式 存储 空间 。 存 储 位 ”8 
个 位 置 占有 连续 4 个 字 节 置 为 16 位 宽 ， 占 有 两 个 字 节 a。 外 所 
围 设备 空间 被 映射 到 连续 的 奇数 S 
字 节 中 @ 


图 4-8 将 8 位 外 围 设备 映射 到 16 位 总 线 


图 4-9 显示 的 外 围 设备 具有 4 个 8 位 寄存 器 ， 以 存 
储 器 映射 方式 映射 至 地 址 0x080001。 在 程序 员 看 来 ，4 
个 8 位 寄存 器 的 地 址 为 0x080001、 0x080003, 0x080005 
和 0x080007s :地址 0x080000、0x080002、0x080004. 和 
0x080006 PFE, TEHE., mover 指令 自动 在 数据 寄 
存 器 以 及 具有 字 节 宽度 的 存储 器 映射 外 围 设备 间 移 动 16 
位 或 32 位 的 值 。 寄 存 器 的 内 容 被 移动 到 连续 的 偶数 (或 
奇数 ) 字 节 地 址 。 例 如 ;MovEP.L v2, (ao) 指令 将 寄存 
器 D2 中 的 4 个 字 节 拷贝 至 地 址 [A0]+0、[A0]+2、 [A0]+4 
和 [A0]+6，; 其 中 :A0 是 一 个 地 址 或 指针 寄存 器 。 


RE EF 


O7FFFE 


080008 
08000A 
08000C 
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图 4-9 具有 字 节 宽度 的 存储 器 映射 
的 外 围 设备 实例 


图 4-10 演示 了 MovEP.L po, (A0) 指令 从 地 址 0x080001 开始 如 何 将 寄存 器 DO 中 的 4 个 
字 节 拷贝 至 存储 器 中 连续 的 奇数 地 址 。68000 处 理 器 中 代码 后 缀 . 工 ” 代 表 .:32 位 操作 ,，“.B” 
代表 字 节 操作 。 数据 寄存 器 中 的 最 高 位 字 节 被 传输 给 最 低 的 地 址 。 若 没有 Mover 指令 ， 则 需 
要 通过 下 面 的 代码 将 4 个 字 节 传输 至 存储 器 映射 的 外 围 设备 。 
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=y 数据 寄存 器 
外 围 设备 1615 87 





寄存 器 中 的 连续 字 节 被 
传输 给 连续 的 奇数 地 址 


4-10 使 用 16 位 总 线 的 8 位 外 围 设 备 
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MOVE.L #Peri,A0 5 AO 指向 存储 器 映射 的 外 轩 设 备 
MOVE.B D0, (6,A0) ; 将 寄存 器 DO 中 的 最 低位 字 节 传输 给 外 围 设备 


ROR.L #8,D0 ; D0 寄存 器 循环 右 移 来 获取 下 一 个 字 节 
MOVE.B D0, (4,A0) ; 将 下 一 个 字 节 ， 即 原 寄 存 器 D0 中 8 一 15 位 传输 给 外 围 设备 
ROR.L #8,D0 ; 重复 


MOVE.B DO, (2,A0) 

ROR.L #8,D0 

MOVE.B DO, (0,A0) 

ROR.L #8,D0 ; 4 次 循环 移 位 后 回 到 Do 原始 的 值 


每 传输 一 个 字 节 ， 其 拷贝 的 目标 地 址 与 当前 地 址 间隔 两 个 字 节 。 每 次 数据 传输 后 ROR.L 
#8，D0 指令 都 将 D0 中 的 ,32 位 值 右 移 8 位 使 下 次 需要 传输 的 字 节 位 于 最 低 的 字 节 。 而 使 用 
mover 指令 ， 整 个 代码 可 以 减少 为 : 

MOVE.L #Peri,A0 ; AO 指向 存储 器 映射 的 外 围 设备 

MOVEP.L DO, (A0) ; 将 D0 中 的 字 传 输 至 外 围 设 备 

注意 这 段 代 码 十 分 紧凑 。MovEP 是 一 条 很 好 的 、 可 以 执行 有 用 任务 的 指令 ， 但 其 并 不 是 
一 个 必要 的 指令 。 

1. 保存 1/0 操作 的 顺序 

RISC 体系 结构 只 提供 存储 器 加 载 和 存储 操作 ， 并 没有 实现 便于 IO 操作 的 指令 。 然 而 ， 
在 有 些 情况 下 ，RISC 组 织 和 存储 器 映射 的 IO 会 冲突 。 前 面 介绍 过 ， 一 些 存储 器 映射 的 外 
围 设备 具有 配置 和 自动 复位 状态 寄存 器 或 者 自动 递增 指针 。 以 恰当 的 、 程 序 员 定 义 的 序列 来 
访问 这 些 外 围 设备 十 分 重要 。 因 为 超标 量 RISC 处 理 器 采用 了 机 会 主义 方法 来 访问 存储 器 ， 
数据 可 以 以 乱 序 方式 存储 至 存储 器 。 这 种 乱 序 存储 器 访问 不 会 对 数据 存储 和 检索 造成 问题 ， 
但 它 会 破坏 存储 器 映射 的 IO。 

PowerPC 实现 了 eieio (enforce in-order execution of IO ， 强 制 顺序 执行 的 IO) 指令 ， 
该 指令 没有 参数 ;但 确保 完成 了 所 有 之 前 启动 的 存储 器 访问 。 考 虑 以 下 这 个 例子 ， 两 个 载 人 
操作 后 面 紧 接 着 一 个 加 法 运算 。 


lwz r5,1000(r0) ; 将 存储 器 地 址 为 工 000 HAAMRE v5 
lwz r6,1040(r0) ; 将 存储 器 地 址 为 1040 的 内 容 加 载 至 r6 
add r7,r5,r6 ; r7=r5+r6 


当 执 行 这 些 指令 时 ， 处 理 器 可 以 交换 r5 和 r6 从 存储 器 加 载 的 顺序 s RE MRSS A 
完成 了 两 个 加 载 操 作 ， 加 法 的 结果 就 不 依赖 于 加 载 的 顺序 。 假 设 地 址 1000 和 .1040 是 存储 器 
映射 的 位 置 。 例 如 ,设计 的 外 围 设备 在 对 地 址 1000 进行 读 访 问 后 修改 了 地 址 1040 处 的 寄存 
器 ， 两 个 加 载 指 令 的 顺序 就 变 得 十 分 重要 了 ， 交 换 它们 的 顺序 可 能 导致 不 正确 的 结果 。 

考虑 下 面 这 个 需要 更 新 外 围 设备 的 例子 。 因 为 寄存 器 需要 通过 指针 来 访问 ， 在 向 指针 寄 
存 器 所 指示 的 寄存 器 中 写 人 数据 之 前 ， 需 要 先 将 寄存 器 地 址 写 人 指针 寄存 器 。 本 例 中 ， 需 要 


158 $4AF 


向 编号 为 35 的 外 围 寄 存 器 加 载 数值 99。PowerPC 的 代码 为 : 


addi 4r5,r0,35 ; r5=35 (ERE Powerpc # r0 RZ 0) 

addi r6,r0,99 3; r6=99 

stw r5,1234 (r0) ; 将 35 存 储 在 1234 这 个 位 置 (指针 内 容 为 1234 ) 

stw  r6,5678(r0) ; 将 99 存储 在 5678 这 个 位 置 

这 两 个 写 操作 必须 以 正确 的 顺序 执行 。 为 了 确保 这 一 点 ，PowerPC 有 3 个 同步 指令 : 


eieio、sync 和 isync, isyne 指令 强制 指令 或 存储 事务 在 继续 往 下 执行 之 前 完成 ; 也 就 是 说 ， 
isync 之 前 的 指令 被 执行 完 ， 预 取 的 指令 被 丢弃 。 然 后 ， 才 开始 新 的 取 指 。 指 令 eieio 在 后 
续 写 操 作 之 前 强制 所 有 未 完成 的 写 操作 被 完成 。sync 指令 强制 在 执行 后 面 的 指令 之 前 将 所 
有 以 前 的 读 和 写 操作 在 总 线 上 完成 。 通 过 在 写 操 作 之 间 插 和 人 eieio 指令 ， 可 以 确保 前 面 的 代 
码 以 正确 的 顺序 运行 。 


addi 25,70,35 3 r5=35 

addi r6,r0,99 3 r6=99 

stw r5,1234 (r0) ; M[1234]=35; 即将 改变 寄存 器 r5 
eieio ; 在 继续 之 前 确保 r5 的 内 容 被 写 入 
stw r6,5678 (r0) ; M[5678] =99; 寄存 器 值 为 99 

2. 副作用 


在 结束 介绍 存储 器 映射 的 IO 之 前 ， 必 须 介 绍 指令 副作用 (side effect) 这 一 概念 。 一 条 
指令 应 该 精确 地 完成 它 应 该 做 的 任务 ， 不 能 有 更 多 的 功能 。 考 虑 68000 处 理 器 的 cLR <ea> 
指令 ， 它 将 清除 指定 有 效 地 址 (ea) 处 的 操作 数 ; 也 就 是 说 ，[eal 0。 很 简单 ， 不 是 吗 ? 
然而 ，CLR 操作 的 内 部 实现 为 : 

[Temp] < [ea] ; BŽ (CLR 指令 的 副作用 ) 

[ea] < 0 ; 实际 的 CLR 操作 

第 一 个 操作 为 假 读 (dummy read， 或 旺 读 )， 其 后 为 存储 器 清除 操作 。 前 文 介 绍 过 ， 有 
些 外 围 设备 需要 使 用 读 和 写 访问 来 区 分 寄存 器 对 。CLR 指令 将 导致 对 一 个 寄存 器 的 假 读 ， 
然后 向 另 一 个 寄存 器 写 和 零 。 这 是 个 问题 吗 ? 正确 的 寄存 器 将 被 清除 ， 另 一 个 具有 相同 地 址 
的 寄存 器 会 被 执行 读 操作 。 虽 然 对 存储 器 的 读 操作 是 无 害 的 ;但 是 读 取 具有 自动 清除 ( self- 
clearing) 标志 位 的 状态 寄存 器 会 导致 状态 被 清除 。 这 里 的 CLR 指令 看 上 去 很 无 境 ; 但 可 能 
会 在 存储 器 映射 的 系统 中 导致 无 法 解释 的 副作用 。 


4.2 数据 传输 


要 理解 数据 传输 需要 3 个 至 关 重要 的 概念 : 开 环 传输 (open-loop transfer)、 闭 环 传输 
(closed-loop transfer) 和 数据 缓冲 〈data buffering)。 开 环 传输 过 程 中 ， 信 息 发 出 后 即 被 假定 
能 够 正确 地 接收 。 闭 环 传输 过 程 中 ， 接 收 方 主动 通知 发 送 方 数据 已 经 接收 。 数 据 缓 冲 涉及 处 
理 数据 传输 速率 和 接收 方 接收 (consume) 速率 之 间 的 差异 。 


4.2.1 开 环 数据 传输 


传输 数据 最 简单 的 方法 就 是 将 数据 放 在 总 线 上 并 发 出 信号 (或 者 数据 选 通 ) 来 表明 数据 
已 经 有 效 。 图 4-11 展示 了 在 外 围 接口 部 件 和 外 围 设备 (如 打印 机 ) 之 间 的 开 环 传输 。 处 理 器 
通过 其 地 址 和 数据 总 线 将 数据 移动 到 外 围 接 口 ， 外 围 接口 再 将 数据 放 到 总 线 上 。 

外 围 接口 发 出 数据 有 效 (data avaliable) 选 通信 号 DAN 向 外 围 设备 指示 在 其 输入 端的 数 
据 是 有 效 的 。 外 围 设备 读 取 数据 ， 外 围 接口 将 作废 DAN 来 完成 传输 。 
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外 围 接口 外 围 设备 
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4-11 ” 开 环 数据 传输 


图 4-12 给 出 了 这 一 信息 交换 过 程 的 时 序 图 ， 它 被 称 为 开 环 是 因为 没有 反馈 来 确认 数据 
已 经 真正 被 接收 。 如 果 外 围 设备 处 于 离线 、 忙 碌 或 是 速度 很 乙 ， 数 据 有 效 (Bl DAV 有 效 ) 
的 时 间 段 内 数据 可 能 还 没有 被 读 取 。 开 环 数 据 传输 也 被 称 为 同步 (synchronous) 传输 ， 因 为 
接收 数据 的 设备 必须 与 发 送 数据 的 设备 同步 。 


A B CD 


数据 









DAV 
GS) 数据 开始 有 效 `| 数 据 不 再 有 效 
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图 4-12 开 环 数据 传输 的 时 序 图 


4.2.2 ”闭环 数据 传输 


在 闭环 传输 过 程 中 ， 接 收 数据 的 设备 向 发 送 方 返回 一 个 确认 信号 形成 闭环 。 图 4-13 与 
图 4-11 类 似 ， 除 了 有 一 个 以 数据 传输 确认 (data transfer acknowledge) 信号 ACK 为 标记 的 
反馈 路 径 。 图 4-14 提供 了 相应 的 时 序 图 。 外 围 接口 使 数据 有 效 ， 在 B 点 发 出 DAV 信号 表 
明 数 据 有 效 ( 与 开 环 数据 传输 一 样 )。 接 收 数据 的 外 围 设备 发 现 DAV 有 效 并 读 取 数 据 。 反 过 
来 ,外围 设备 发 出 ACK 通知 接口 数据 已 被 接收 。 接 口 撤回 DAV 信号 (使 信号 翻转 失效 ) 来 
完成 数据 交换 。 这 种 事件 的 序列 被 称 为 握手 ( handshaking)。 握 手 通过 将 传输 挂 起 直到 外 围 
设备 发 出 ACK 表明 其 已 经 就 绪 这 种 方式 ， 可 以 支持 慢 速 的 外 围 设备 。 

4-14 中 的 时 序 图 称 为 握手 ， 因 为 ACK 的 发 出 对 应 DAN 的 发 出 。 闭 环 数据 传输 的 优点 
是 数据 的 发 送 者 知道 数据 已 被 接收 ， 不 会 因为 远程 外 围 设备 没有 读 取 数 据 而 造成 数据 丢失 。 

图 4-14 中 的 握手 闭环 协议 可 以 再 进一步 。 在 图 4-14 中， 发 出 DAV 后 由 外 围 设备 发 出 
ACK 信和 号 进行 匹配 a。 此 时 ,假定 数据 已 经 收 到 ， 数 据 交换 完成 。 图 4-15 显示 了 完全 互 锁 的 
握手 ( fully in ter lock ed handshaker) 协议 ， 其 中 事件 的 顺序 被 更 严格 地 定义 ,每 个 事件 按 
顺序 触发 下 一 个 事件 。 

在 图 4-15 PA BAR, Ri DAV 信号 表示 数据 有 效 ， ECA, RH ACK 信号 表示 数据 
被 收 到 。 该 序列 继续 下 去 ,在 D 点 使 DAV 失效 。 外 围 接口 可 以 使 DAV 失效 是 因为 ACK 信 
号 表明 DAV 已 经 被 识别 。DAV 失效 可 以 告诉 外 围 设备 其 确认 信和 号 已 经 被 检测 到 。 因 此 ， 外 
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围 设备 在 E 点 使 ACK 信号 失效 。 外 围 接口 也 在 下 点 DAV 失效 后 删除 数据 。F 点 可 能 出 现 
在 互 点 前 ， 因 为 删除 数据 是 对 了 AV 失 效 而 不 是 对 ACK 失效 的 响应 。 
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图 4-15 完全 互 锁 的 闭环 数据 传输 的 时 序 图 


在 所 有 包含 握手 的 数据 传输 中 ， 当 发 送 方 发 出 数据 有 效 信号 而 接收 方 接 下 来 没有 发 出 数 
据 确 认 信和 号 时 (例如 ; 由 于 设备 故障 导致 ) 就 会 出 现 问题 。 当 发 送 方 发 出 数据 时 去 它 在 发 出 
DAV :信号 时 启动 二 个 定时 器 。 如 果 经 过 一 段 时 间 后 接收 方 还 没有 发 出 确认 信号 ,该 操作 就 
会 被 中 止 。 从 某 个 动作 开始 到 声明 为 失败 状态 之 间 的 时 间 称 为 起 时 (timeout ) HERRE 
时 ,将 产生 中 断 ， 迫 使 计算 机 采取 行动 。 


4.2.3 ”缓冲 数据 


当 数 据 在 总 线 上 传输 时 ， 可 以 在 其 有 效 时 立即 使 用 它 ,或 者 将 其 放 信 存储 器 设备 。 
图 4-16 显示 了 外 围 设备 中 可 能 使 用 的 3 种 输入 电路 。 图 4-16a 的 电路 读 取 数据 输入 五 全 五 
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上 的 瞬时 (instantaneous) 值 。 即 ， 当 前 数据 值 被 读 取 ,发送 方 在 数据 被 使 用 时 必须 维持 这 些 数 
据 的 值 。 很 少 实现 这 种 简单 的 输入 机 制 ; 因为 很 难保 证 数据 在 需要 的 时 段 内 一 直 保持 稳定 。 

图 4-16b 描述 了 单 缓冲 ;(single-buffered) 或 锁 存 (latched) 输入 ;其 输入 连接 到 D 触发 
器 。 当 读 取 数据 时 ， 触 发 器 被 锁 存 ， 输 入 被 捕获 。 在 这 种 安排 中 ， 唯 一 的 要 求 是 ， 输 入 数据 
需要 在 其 被 锁定 前 保持 有 效 tw 秒 ， 然 后 在 后 续 时 间 内 保持 ho O (这 是 锁 存 器 的 基本 参数 )。 

单 缓冲 输入 捕捉 数据 并 保持 它 直 到 下 一 次 锁 存 被 启动 。 如 果 数 据 到 达 的 速率 与 数据 从 输 
入 锁 存 读 取 的 速率 接近 ， 这 会 出 现 什么 情况 ?假设 每 tiop 秒 到 达 新 的 输入 数据 ， 外 围 设备 每 
tyce 秒 读 取 数 据 。 如 果 toyo 小 于 bw， 一 切 OQK。 假 设 外 围 设备 在 一 段 短 时 间 内 不 能 读 取 数 
据 〈 例 如 ， 磁 盘 驱动 器 可 能 需要 执行 新 的 寻 道 或 者 执行 热 校正 操作 )。 在 这 种 情况 下 ， 输 入 
数据 在 下 一 个 数据 到 达 之 前 没有 被 读 取 ， 它 就 会 丢失 。 单 缓冲 输入 在 到 达 率 可 以 超过 读 取 速 
率 时 不 能 可 靠 地 工作 。 

图 4-16c 为 上 一 个 数据 被 读 取 之 前 就 会 到 来 新 数据 的 问题 提供 了 一 种 解决 方案 。 初 始 
时 ， 输 入 数据 锁 存 如 图 4-16b 一 样 。 然 而 ， 输 入 锁 存 中 的 数据 然后 被 复制 到 第 二 
输出 锁 存 ， 数 据 在 其 中 被 第 二 次 缓冲 。 这 种 安排 意味 着 缓冲 的 输入 端 可 以 捕获 数据 而 输出 端 
在 等 待 旧 的 数据 被 读 取 。 当 然 ， 如 果 第 三 个 数据 元 素 接 中 而 至 ， 这 种 安排 就 会 失效 。 








数据 锁 存 输入 锁 存 ”输出 锁 存 


a) 不 缓冲 。 它 意 b) 单 缓冲 。 输 入 c) 双 缓 冲 。 数 据 首 先 被 
味 着 从 终端 读 取 瞬 端的 数据 被 锁 存在 ”捕获 至 输入 锁 存 ， 然 后 
时 值 D 触发 器 中 被 拷贝 至 输出 锁 存 


图 4-16 缓冲 数据 


图 4-17 给 出 了 双 缓 冲 输入 系统 的 时 序 图 。 输 入 数据 以 固定 的 时 间 间 隔 到 达 。 输 入 样本 
在 时 钟 到 来 时 每 隔 G; 时 间 被 送 至 输入 锁 存 ， 其 中 i 为 时 钟 脉冲 号 。 

数据 由 时 钟 Co 锁定 到 输出 锁 存 。 在 这 种 情况 下 ， 数 据 以 不 规则 的 间隔 被 读 取 。 图 4-17 
中 有 两 个 突出 显示 的 例子 。 输 入 样本 i+3 早早 地 被 送 入 输出 锁 存 ， 但 很 久 以 后 才 被 读 取 。 同 
RE, AREA it5 读 取 得 较 晚 而 输入 样本 i+6 读 取 得 较 早 。 正 如 读者 所 看 到 的 ，C6; M Co 
之 间 的 时 间 间 隔 大 于 两 个 连续 输入 间 的 间隔 ， 但 由 于 采用 了 双 缓 冲 技 术 ， 并 没有 出 现 数 据 丢 
失 的 情况 。 

FIFO 

数据 缓冲 更 一 般 的 解决 方案 是 提供 先进 先 出 (first-in-first-out,，FIFO) 的 存储 器 。FIFO 
是 一 种 可 以 植 入 任意 微机 或 外 围 设备 内 核 的 n 级 缓冲 存储 器 。 数据 值 被 依次 写 入 FIFO 队列 
且 按 照相 同 的 顺序 读 出 。 一 旦 数据 被 读 取 ， 就 无 法 再 次 访问 。FIFO 可 以 为 空 、 部 分 填充 或 
者 充满 ; 通常 用 输出 标志 来 指示 其 为 全 空 或 者 部 分 满 。 
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图 4-17” 双 缓冲 输入 的 时 序 图 


最 简单 的 FIFO 结构 是 一 个 具有 输入 端口 (用 于 接收 数据 ) 和 输出 端口 (用 于 提供 数据 ) 
的 寄存 器 。 数 据 源 提供 了 FIFO 的 输入 和 选 通 信号 。 同 样 ， 读 取 方 提供 选 通 信号 表明 其 需要 
BERR FIFO 的 数据 。 图 4-18 中 的 FIFO 具有 两 个 控制 输出 : FULL 表明 FIFO 不 能 再 接收 任 
何 数据 了 ， 而 EMPTY 表明 FIFO 中 没有 任何 可 读数 据 了 。 可 以 把 基于 寄存 器 的 FIFO 理解 
为 可 以 自动 移 位 的 移 位 寄存 器 。 当 数据 到 达 输入 端 ， 它 将 在 移 位 寄存 器 中 行 波 (ripple) 传送 


直到 到 达 下 一 个 空位 置 。 


写 信号 






FULL 信和 号 


当 整 个 移 位 寄存 器 都 包含 数据 ， 则 发 出 FULL 信号 ; 
当 整 个 移 位 寄存 器 为 空 时 发 出 EMPTY 信号 


图 4-18 FIFO 


图 4-19 展示 了 一 个 10 段 (stage) 的 FIFO。 
初始 时 ，FIFO 包含 数据 值 3、9 和 7， 其 中 7 是 
FIFO 中 最 陈旧 的 数据 元 素 ， 而 3 是 最 新 的 数据 
元 素 。 在 图 4-19b 中 ,8 被 写 人 FIFO， 在 图 4-19c 
中 ,6 被 写 入 。 每 个 新 的 数据 从 输入 端 输入 并 排 
在 队列 的 尾部 二 在 图 4-19d 中 ,发 生 了 读 取 数据 
操作 ， 数 据 值 7 被 从 FIFO 中 移 除 。 在 这 个 段 ， 
所 有 数据 元 素 向 前 移动 一 个 位 置 。 接 下 来 是 另 一 
个 写 操作 和 读 操作 。 下 面 将 描述 可 作为 一 块 单 芯 
HHJ FIFO., 

FIFO 通常 通过 随机 访问 存储 部 件 实现 。 

些 存储 部 件 被 安排 为 循环 缓冲 区 (如 图 pi 
示 )。 读 指针 和 写 指针 用 来 指示 RAM 中 的 数据 。 
图 4-21 说 明了 双 端 口 RAM FIFO 的 结构 。 基 于 
RAM ff) FIFO 相 比 于 基于 寄存 器 的 FIFO 具有 的 
优势 是 : 基于 RAM 的 FIFO 中 通过 空位 置 的 时 
间 为 常数 ， 与 其 长 度 无 关 。 该 因素 对 于 具有 儿 千 


读 信号 





EMPTY 信号 
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f) JA FIFO 中 读 出 数据 9 
图 4-19 FIFO 中 数据 移动 实例 
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个 段 的 非常 长 的 FIFO 来 说 十 分 重要 。 


pastes 





一 种 FIFO 的 实现 ; a ee eae 

Be ee ere rer 
上 部 显示 了 由 4 个 交叉 耦合 的 与 非 门 组 成 的 RS 触发 器 并 通过 C1, C2, C3 和 C4 触发 。 
当 其 中 的 一 个 段 被 甬 发 时 ， 来 自前 一 个 段 的 输入 被 锁定 。 FADAEN GAAS AK 
补 码 ，RS 触发 器 的 行为 就 像 一 个 了 触发 器 。 ~ 
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该 移 位 寄存 器 依赖 于 一 种 通常 被 认为 是 有 害 的 效应 。 当 DD 或 RS 甬 发 器 被 能 发 时 ， 
输入 端的 数据 被 行 波 传送 至 其 输出 端 ， 如 果 在 触发 器 将 被 触发 时 数据 发 生 了 变化 ， 该 数 
据 将 穿 过 触发 器 。 这 就 是 为 什么 发 明 主 从 和 边沿 触发 触发 器 的 原因 。 然而 ，FIFO 充分 利 
用 了 电 平 触发 式 触发 器 的 行 波 效 应 。 — 

假设 向 一 一 个 由 4 个 触发 器 构成 的 移 位 寄 在 器 输入 数据 ， ath Cl 和 C4 为 低 电 平 。 什 

也 没有 发 生 。 如 果 发 出 时 钟 输入 CL, AH 入 被 锁 存 至 第 一 段 。 如 果 发 出 时 钟 C2， 
= 段 获得 的 输入 同样 也 会 被 第 二 段 获得 。 为 了 把 该 移 位 寄存 器 变 成 FIFO， 所 要 做 的 就 
是 控制 4 个 段 的 时 钟 输入 。 如 果 输 入 位 置 为 1 且 队列 中 下 一 个 空 闪 位 置 为 i， 所 要 做 的 
就 是 触发 段 ~ i 的 时 钟 ， 导 致 数据 被 行 波 传送 至 FIFO。、 
) 的 控 MES: Clear 信号 对 系统 进行 初始 化 ， 使 得 
FIFO 变 成 空 状态 ; Write 时 钟 输入 ; 据 输 入 FIFO; Read 时 钟 输入 信号 将 FIFO 中 
最 陈 呈 的 数据 项 取出 ;Empty 信号 的 输出 表明 没有 可 以 读 取 的 才 据 ， Full 信号 的 输出 表 
明 FIFO 中 所 有 段 当前 都 被 古 用 。 

控制 部 分 本 身 也 像 一 个 移 位 寄存 器 来 进行 安排 ， 其 输出 为 FIFO 使 用 的 时 钟 信号 。 
如 果 控 制 移 位 寄存 器 的 输出 Q. 的 前 i 个 段 被 置 为 1 时， 这 i 个 时 钟 均 为 高 电 平 ， 数据 将 















= 


da 


位 置 的 标记 。 a8 
LHBERARWLRAT 的 反馈 机 制 。 Peri eri ys 48 FIFO 


非 空 时 的 输出 段 。 D4 的 状态 为 1 ( 即 非 空 )， 时 钟 C4 为 1 (PP FIFO 输出 还 没有 被 时 钟 触 
发 ,数据 仍然 保存 在 输出 端 )。Q4 的 输出 是 D4 的 补 码 ， 此 时 为 0。 

“ 当 Read 时 钟 为 低 时 ， Q4 的 输出 将 被 迫 为 高 。 然而 ， 由 于 Q4 为 高 ， 三 输入 的 与 非 
门 的 输出 在 控制 状态 下 将 变 为 高 ， 此 时 其 3 个 输入 之 一 为 高 。 同样 ， 该 与 非 门 的 输出 将 
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图 4.21 基于 存储 部 件 的 FIFO 结构 


半导体 制造 商 制造 了 两 种 基于 RAM 的 FIFO: 异步 (asynchronous) 和 FIFO 同步 (synchronous) 
FIFO。 当 其 移 人 和 移出 信号 来 源 独 立 ,-FIFO 的 操作 为 异步 的 ; 当 移 人 和 移出 信号 来 自 相 同 
的 时 钟 ， 它 们 之 间 存 在 精确 的 关系 ， 则 FIFO 在 同步 模式 下 操作 。 相 比 异 步 FIFO， 人 们 首 
选 同 步 FIFO。 

除了 缓冲 1/0 事务 外 ，FIFO 还 可 以 提供 更 多 功能 。 图 4-22 演示 了 Texas Instruments 公 
司 的 FIFO 在 某 系统 中 的 使 用 ， 该 系统 具有 使 用 小 端 IO 的 32 位 计算 机 和 使 用 大 端 VO 的 8 
位 端 日 。 该 FIFO 可 由 用 户 配置 ， 可 以 设置 为 执行 总 线 匹配 (bus matching); 也 就 是 说 ， 其 
输入 和 输出 总 线 可 能 有 不 同 的 宽度 。 这 里 ， 其 端口 A 的 接口 为 32 位 宽 ， 其 端口 B 的 接口 
为 8 位 宽 。 此 外 ， 还 可 以 对 其 编程 实现 当 数据 从 小 端 系统 向 大 端 系统 拷贝 时 的 数据 交换 。 图 
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4-23 给 出 了 将 两 个 32 位 的 数据 字 写 大 FIEFO 以 及 从 IEFO 中 读 出 ;8 个 字 节 的 时 序 图 ; 


| 微 处 理 器 SN74ABT3614 zpi 
FIFO 
Daoo ~ Das: 


Deo ~ Dar Aa 





图 4.22 使 用 FIFO 将 系统 与 不 同 的 总 线 赏 度 和 端 格 式 相连 
a (ai esd bigots gona = 
写 时 钟 


Dau ~ Dasi 





Dars ~ Dan 


a 
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Dao ~ Dao 


a) 使 用 小 端 格式 将 32 位 数据 写 人 FIFO 
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b) 使 用 大 端 格 式 从 FIFO 中 读 取 8 位 数据 
图 4-23 ”图 4-22 对 应 的 时 序 图 


至 此 ， 本 书 已 经 介绍 了 将 数据 移 人 和 移出 计算 机 的 词汇 和 基本 策略 。 后 文 将 对 IO 性 能 
进行 概述 。 


4.3 1/0 策略 


计算 机 通过 3 种 方式 实现 IO 事务 处 理 。 它 可 以 使 用 程序 控制 TO (programmed I/O) 方 
式 处 理 单独 的 IO 事务 。 它 可 以 使 用 中 断 驱动 IO_(interrupt-driven IO ) 方式 在 外 围 设备 发 
出 参与 1O 事务 就 绪 信号 之 前 执行 其 他 任务 。 它 可 以 使 用 直接 存储 器 访问 (direct memory 
access, DMA) 方式 通过 专用 硬件 来 执行 IO 事务 处 理 。 计算 机 系统 还 可 以 使 用 这 些 策略 的 
混合 策略 。 本 节 首 先 介绍 简单 的 程序 控制 JVO 机 制 , 通过 执行 适当 的 输入 或 输出 指令 将 数据 
移 人 或 移出 系统 = -本 节 的 主要 部 分 介绍 外 围 设备 用 于 请 求 数据 传输 的 中 断 机 制 。 中 断 驱 动 
WO 比 程序 控制 I/JO EAX, 因为 它 只 在 外 围 设备 就 绪 时 发 生 s B= A VO Hie, DMA, 
是 最 复杂 的 二 种 策略 ， 因 为 它 需 要 一 个 控制 子 系 统 接管 总 线 控制 和 在 外 设 和 存储 器 之 间 初 
始 化 数据 传输 a 处 理 器 可 以 根据 实际 配置 在 DMA 操 作 期 间 暂 停 或 者 可 以 将 其 自己 的 操作 与 
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DMA 周期 交织 在 一 起 。 例 如 ， 当 CPU 从 它 自己 的 内 部 缓存 读 取 指令 和 数据 时 ，DMA 控制 
器 可 以 直接 在 主 存 储 器 和 磁盘 驱动 器 之 间 传 输 数 据 。 


4.3.1 程序 控制 |/O 


典型 的 存储 器 映射 外 围 设备 有 一 个 标志 位 ， 它 在 外 围 设备 准备 参加 数据 传输 时 被 外 围 设 
备 置 位 。 在 程序 控制 1/0 方式 中 ,计算 机 会 询问 外 围 设备 的 状态 寄存 器 ， 当 外 围 设备 准备 就 
绪 后 进行 处 理 。 可 把 这 一 操作 用 伪 代 码 描述 为 : 

REPEAT 

读 外 围 设备 状态 

UNTIL 外 围 设备 就 绪 

与 外 设 之 间 传 输 数据 

操作 “REPEAT 读 外 围 设备 状态 -UNTIL 外围 设备 就 绪 ” 组 成 了 轮 询 循环 ， 需 要 不 断 测 
试 外 围 设备 的 状态 直到 它 准 备 就 绪 可 以 参加 IO 事务 。 在 下 面 的 示例 中 ， 如 果 外 围 设 备 有 数 
据 ， 则 状态 位 RDY 被 置 位 。 如 果 使 用 图 4-4 中 的 IO 模型 ， 将 伪 代 码 翻 译 成 一 般 的 汇编 语 
言 形式 来 执行 输入 操作 ， 可 以 得 到 : 


ADR r1,i0 ; 寄存 器 r1 指向 外 围 设备 

MOV r2, #Command 定义 外 国 设 备 操作 模式 

STR [r1] ,72 入 载 入 命令 来 配置 外 围 设备 
Rptl LDR r3,[r1, #2] ; 将 输入 状态 字 读 至 v3 

AND r3,r3, #1 ; Af BRDY n 位 屏蔽 状态 

BEQ Rpt1 ; 重复 直到 设备 就 绪 

LDR r3,[r1,#4] ; 将 数据 读 至 r3 


外 围 设备 中 的 寄存 器 偏 移 量 是 2 和 4， 而 不 是 1 和 2， 因 为 处 理 器 为 字 节 寻 址 设备 ， 而 
这 里 假定 IO 端口 的 寄存 器 是 16 位 的 。 在 实践 中 ， 代 码 会 更 复杂 ， 因 为 多 数 状 态 寄存 器 都 
包含 错误 位 。 如 果 包 含 错误 检测 的 话 ， 上 面 的 代码 可 能 会 变 成 如 下 代码 : 


ADR r1,i0 ; 寄存 器 r1 指向 外 围 设备 
MOV r2,#Command ; 定义 外 围 设备 操作 模式 
STR [r1] ,r2 ; 配置 外 围 设备 

Rpti LDR r3, [r1,#2] ; 将 输入 状态 字 读 至 r3 
MOV r4,r3 ; 将 状态 字 的 副本 拷贝 至 r4 
AND r4,x4,#Error ; 向 全 局 错误 位 屏蔽 状态 
BEQ BigFault ; 处 理 错 误 
MOV r4,r3 ; 为 下 次 测试 恢复 状态 
AND r4,r4,#RDY ; 对 RDYm 位 屏蔽 状态 
BNE Rptl ; 重复 直到 设备 就 绪 
MOV r4,r3 ; 为 下 次 测试 恢复 状态 
AND r4,r4,#0K ; 寻找 操作 错误 
BEQ TinyError ; 处 理 错误 
LDR r3, [r1,#4] ; 读 取 数 据 


输入 子 程序 测试 Error 状态 位 ， 该 位 在 端口 不 能 正常 工作 时 被 置 位 。 接 下 来 ， 检 查 就 绪 
状态 位 。 如 果 就 绪 位 被 置 位 标识 新 的 输入 ， 将 检查 另 一 个 错误 位 一 一 ok， 来 测试 当前 输入 是 
否 出 现 错误 。 

如 果 状 态 位 是 自动 清除 的 ， 必 须 将 状态 字 保 存 至 寄存 器 然后 在 需要 它 的 时 候 再 从 寄存 器 
中 拷贝 。 每 次 需要 测试 状态 字 中 的 一 位 时 ,就 可 以 从 r3 中 重新 获得 该 状态 字 。 

程序 控制 的 WO 由 于 低 效 并 没有 被 广泛 采用 。 假设 平均 每 条 指令 需要 志 ., 秒 执行 时 间 ， 
VO 事务 每 To 秒 发 生 一 次 。 在 VO 事务 中 ， 处 理 器 处 于 轮 询 循环 中 ， 而 处 理 器 本 可 以 执行 
To/tiat 条 有 用 的 指令 。 例如， 如 果 处 理 器 速度 为 10 000 000 条 指令 /s, tng=100ns, VO 设备 
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为 键盘 ， 其 操作 速度 为 To=10 PEH Is, Tuolta 的 结果 为 1 000 000。 也 就 是 说 ， 对 于 每 
个 输入 操作 ， 处 理 器 花 了 100 万 条 指令 的 执行 时 间 但 没有 完成 有 用 的 工作 。 在 下 二 节 中 ,将 
介绍 可 以 避免 轮 询 的 1/O 策略 ,该 策略 在 外 围 设备 就 绪 时 才 中 断 处 理 器 的 执行 。 


4.3.2 中断 驱动 I/O 


更 高 效 的 IO 策略 是 使 用 中 断 处 理 ( interrupt handling) 机 制 来 处 理 IO 事务 的 发 生 。 即 
处 理 器 执行 其 他 的 任务 ， 直 到 外 围 设备 发 出 需要 处 理 的 请 求 。 当 外 围 设备 就 绪 时 ,， 它 中 断 
(interrupt) 处 理 器 ， 进 行事 务 处 理 ， 然 后 处 理 器 返回 中 断 前 的 状态 。 图 4-24 描述 了 一 个 使 
用 中 断 驱 动 IO 方式 的 系统 。 两 个 外 部 接口 组 件 都 能 够 向 处 理 器 发 出 请 求 。 多 数 外 围 设备 具 
有 低 电 平 有 效 (active-low) AY PBA (IRQ) 输出 ， 各 外 围 设备 的 IRQ 都 与 处 理 器 下 @ 的 
输入 连接 。 低 电 平 有 效 意味 着 低 电 压 表 示 有 中 断 请 求 的 状态 。 使 用 低 电 平 状态 来 表示 有 效 状 
态 的 原因 完全 是 由 于 晶体 管 的 行为 ; 也 就 是 说 ， 它 是 一 个 工程 上 的 考虑 ， 可 以 追溯 到 集 电极 
开路 的 时 代 ， 该 电路 只 能 将 一 条 线 上 的 电压 下 拉 至 零 。 
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向 CPU 发 出 中 断 请求 


图 4-24 中 断 驱动 VO 的 基本 结构 


每 当 外 围 设 备 想 参加 IO 事务 ， 它 发 出 耻 Q 信号 ， 并 使 CPU 的 IRQ 输入 为 低 电 平 有 
效 。CPU 检测 到 其 IR 已 经 有 信和 号， 如果 该 请 求 没 有 被 屏蔽 ， 则 响应 该 中 断 请 求 。 大 多 数 
处 理 器 都 具有 中 断 屏 蔽 寄存 器 (interrupt mask register)， 如 果 CPU 在 执行 重要 操作 时 允许 关 
闭 中 断 。 即 当 处 理 器 在 执行 关键 任务 时 可 以 屏蔽 中 断 。 例 如 ， 使 用 实时 监测 快速 事件 的 系统 
不 会 响应 键盘 输入 的 中 断 ( 即 使 是 最 快速 的 电脑 打字 员 相 对 计算 机 的 内 部 操作 来 说 也 是 极其 
缓慢 的 )。 同 样 ， 从 系统 故障 (例如 掉 电 ) 中 恢复 也 具有 这 种 屏蔽 中 断 的 优先 权 。 

处 理 器 响应 中 断 的 方式 与 设备 相关 。 图 4-24 中 的 两 个 外 围 设备 连接 到 相同 的 IRQ 信和 号 
线 ，CPU 不 能 确定 是 由 哪个 设备 发 出 了 中 断 请 求 。CPU 通过 查询 (polling) 每 个 外 围 设备 的 
状态 寄存 器 来 定位 中 断 源 。 中 断 查询 机 制 提 供 了 中 断 优先 级 (interrupt prioritization), 因为 
重要 设备 的 中 断 请 求 需要 被 迅速 响应 而 被 首先 查询 。 

在 图 4-24 中 ， 每 个 存储 器 映射 的 外 围 设备 具有 中 断 向 量 寄存 器 (interrupt vector 
register，IVR)， 告 诉 处 理 器 如 何 找到 合适 的 中 断 处 理 程 序 。 通 常 ，IVR 提供 中 断 向 量 表 的 
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指针 。 
人 中 断 处 理 
中 断 是 异步 (asynchronous) 事件 ， 因 为 处 理 器 不 可 能 知道 外 围 设备 (如 键盘 ) 何 时 将 产 
生 中 断 。 当 中 断 发 生 时 ,计算 机 首先 决定 是 响应 它 还 是 忽略 它 。 从 CPU 接收 到 中 断 请 求 开 
始 到 响应 中 断 的 时 间 被 称 为 中 断 延 迟 (interrupt latency)。 计 算 机 响应 中 断 时 ， 它 执行 以 下 
操作 顺序 。 
“ee 完成 当前 指令 。 指 令 是 不 可 分 割 的 (indivisible)， 必须 被 完整 地 执行 
o 程序 计数 器 (program counter, PC) 的 内 容 被 保存 以 允许 程序 可 以 从 断 点 处 继续 执行 。 
CISC 处 理 器 将 程序 计数 器 保存 在 栈 中 ， 故 中 断 自己 还 可 以 被 中 断 ， 而 不 会 丢失 其 返 
回 地 址 。 大 多 数 RISC 处 理 器 将 PC 保存 在 链接 寄存 器 (link register) 中。 
o 处 理 器 的 状态 也 必须 保存 。 处 理 器 的 状态 由 条 件 码 的 标志 位 以 及 其 他 状态 信息 来 定 
Mo 假设 某 条 指令 设置 了 Z 位 ， 下 一 条 指令 需要 测试 Z 位 。 显然 ,如 果 在 设置 Z 位 
和 测试 Z 位 的 指令 之 间 发 生 了 中 断 ， 中 断 机 制 必须 保证 Z 位 的 状态 不 被 修改 。 
© 然后 跳跃 至 中 断 处 理子 程序 的 位 置 开 始 处 理 ， 就 像 执 行 男 外 一 个 子 程序 那样 。 在 该 
子 程序 被 执行 后 ， 需 要 进行 中 断 返回 ,恢复 程序 计数 器 ， 系 统 状态 字 恢 复 至 中 断 前 
的 值 。 
图 4-25 说 明了 典型 的 CISC 处 理 器 是 如 何 响应 中 断 请 求 的 。 动 作 “ Stack PSR” 表 示 
处 理 器 状态 寄存 器 (PSR) 被 压 栈 。 中 断 对 于 被 中 断 的 程序 来 说 是 透明 的 ， 处 理 器 必须 在 中 
断 处 理 完 成 之 后 迅速 返回 中 断 前 的 状态 。 下 面 将 简单 定义 一 些 用 于 讨论 中 断 和 异常 的 关键 
概念 。 








中 断 
— chai Ate 
CPU 调用 中 断 处 理 程序 
保存 工作 寄存 器 
。 | | 申 断 处 理 过 程 
用 户 提供 的 中 断 处 理 各 
EMARE TEE | 应 来 处 理 中 上 
ands PSR PREEN 中 断 返 回 过 程 7 
作 恢 复 PC CPU 从 中 断 处 理 程序 中 R 
i 返回 2 
| SLE ` 
' © 
”图 4-25 “使 用 栈 来 保存 返回 地 址 的 中 断 处 理 过 程 
2. 不 可 屏蔽 中 断 


有 一 类 中 断 请 求 (interrupt request) 被 称 为 不 可 屏蔽 Cnonmaskable) 中 断 ; 这 是 因为 其 
不 可 以 被 拒绝 或 被 延迟 (deferred)。 有 时 需要 计算 机 必须 响应 中 断 ， 无 论 它 正 在 做 什么 。 某 
些微 处 理 器 具有 不 可 屏蔽 的 中 断 请 求 CNMI)， 该 请 求 不 能 被 延迟 必须 被 服务 -不 可 屏蔽 中 
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断 必须 被 保留 来 处 理 类 似 掉 电 这 样 的 事件 。 在 此 情况 下 ， 低 压 检测 器 在 电力 开始 下 降 时 尽 可 
能 快 地 产生 不 可 屏蔽 中 断 5 NMI 处 理子 程序 使 处 理 器 处 理 中 断 ， 在 系统 电力 下 降 至 使 计算 
机 完全 失效 的 危险 水 平 之 前 有 序 地 关闭 系统 。 

在 多 个 设备 可 以 发 出 中 断 请 求 的 环境 中 ， 需 要 一 种 机 制 来 区 分 重要 和 次 重要 的 中 斯 = 例 
如 ， 如 果 由 于 磁盘 具有 可 以 被 处 理 器 读 取 的 数据 而 使 控制 器 产生 中 断 ， 中 断 必须 在 数据 可 能 
被 磁盘 驱动 器 中 的 新 数据 替换 而 失效 之 前 被 处 理 。 另 一 方面 ,由 键盘 接口 产生 的 中 断 在 其 被 
服务 之 前 可 能 有 200ms 至 几 秒 的 时 间 ， 因 此 ， 从 键盘 来 的 请 求 在 其 他 设备 发 出 需要 立即 服 
务 的 请 求 时 可 能 被 迫 等 待 。 

3. 中 断 优先 级 

微 处 理 器 通常 支持 带 有 优先 级 的 中 断 〈 即 芯片 具有 多 个 中 断 请 求 输入 )。 每 个 中 断 都 有 

预定 义 的 优先 级 ， 具 有 与 当前 中 断 相 同 或 更 低 优先 级 的 新 中 断 不 能 中 断 处理 器 ， 直 到 当前 中 
断 已 被 处 理 。 同 样 ， 具 有 更 高 优先 级 的 中 断 可 以 中 断 当 前 中 断 的 处 理 。 稍 后 将 介绍 IA32 的 
中 断 处 理 机 制 。 


中 断 和 异常 

本 章 主要 关注 的 肉 容 之 二 是 中 断 ， 它 来 自 外 围 设备 发 出 的 请 求 。 中 断 与 I/O 操作 密 
切 相 关 。 然 而 ， 中 断 可 以 由 其 他 硬件 事件 产生 ， 如 定时 器 超时 (例如 ， 周期 性 的 中 断 可 
用 于 在 多 任务 系统 中 进行 任务 切 狐 ) 

中 断 可 以 用 来 处 理 异 常事 件 ， 知 子 系统 失效 或 者 神 电 。 

这 种 硬件 中 断 是 一 类 称 为 异常 ( exception) 的 事件 集合 的 一 部 分 。 中 断 、 复 位 以 及 
页 故障 都 是 来 源 于 硬件 的 异常 ， 虽然 复位 不 常见 是 因为 没有 从 复位 中 返回 这 种 情况 。 与 
硬件 异常 一 样 ， 还 存在 软件 异常 一 它们 来 自 处 理 器 中 的 软件 。 软 件 异常 表现 得 完全 像 
硬件 异常 ， 唯一 的 区 别 是 ， 它 起 源 于 软件 并 自动 提供 恰当 的 异常 处 理 程序 地 址 (不 像 硬 
件 中 断 ， 由 设备 提供 一 个 向 量 或 者 处 理 器 通过 循环 轮 询 查询 地 址 )。 

有 两 种 类 型 的 软件 异常 : 处 理 器 启动 和 程序 启动 的 异常 。 处 理 器 启动 异常 扣 是 由 于 ， 
sare 这 些 并 党 可 以 是 过 作为 hy Sea A A 

fae fo Ve 
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Sighs SERENA. 操作 系统 被 调用 ， 人 人行。 直入 
: “机制 可 用 于 确保 处 理 器 系列 的 软件 兼容 。 i R NEAR ATE (janob 








4. RRE 
中 断 和 其 他 处 理 器 异常 具有 子 程序 的 所 有 特点 ， 其 返回 地 址 在 调用 开始 时 被 压 栈 ， 一 


170 4# 


子 程序 已 经 执行 完成 时 返回 地 址 被 恢复 。 中 断 就 是 一 种 子 程序 调用 ， 它 由 硬件 或 者 软件 自动 
提供 目标 地 址 ， 并 且 提 供 了 保护 条 件 码 状态 以 及 程序 计数 器 的 机 制 。 

正如 子 程序 可 以 骨 套 那样 ， 中 断 也 可 以 典 套 。 图 4-26 显示 了 1 级 中 断 被 调用 、 处 理 、 
然后 返回 正常 处 理 的 过 程 。 接 着 1 级 中 断 第 三 次 发 生 。 然 而 ， 在 此 情况 下 ,1 级 中 断 处 理 程 
序 完成 任务 之 前 发 生 了 2 级 中 断 。 此 时 ，1 级 中 断 处 理 程序 被 中 断 (暂停 )， 开 始 进行 2 级 中 
断 处 理 。 当 2 级 中 断 已 被 处 理 ， 返 回 1 级 中 断 处 理 程序 ， 完 成 被 中 断 (暂停 ) 的 中 断 。 


时 间 正常 处 理 1 级 中 断 2 级 中 断 






1 级 中 断 被 中 断 ， 
处 理 2 级 中 断 


2 级 中 断 处 理 完 
成 后 ; 返回 1 级 
中 断 继续 处 理 
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图 4-26 "PRE 


考虑 下 面 这 个 中 断 优先 级 和 中 断 和 能 套 的 例子 。 系 统 有 6 个 级 别 的 中 断 优先 级 ， 每 隔 
10hs 发 生 一 个 中 断 。 假 定 所 有 中 断 需 要 Sys 才能 完成 。 表 4-2 按照 中 断 的 优先 级 给 出 了 它 
们 的 顺序 ， 图 4-27 展示 了 它们 (在 这 个 假想 的 例子 中 ) 是 如 何 被 执行 的 。 

表 4-2 优先 级 中 断 实例 
| 
六 可 ed Cee ate Oe pee Boe Se 
San ee A ee Se eae Pe Cig sonora 







时 间 槽 /hs 中 断 级 









5. 中 断 向 量 

当 具 有 单个 中 断 请 求 线 的 处 理 器 检测 到 服务 的 请 求 ， 它 并 不 知道 是 哪个 设备 发 出 的 
请 求 ， 在 它 确 定 中 断 源 之 前 ， 无 法 开始 执行 适当 的 中 断 处 理 程序 。 中 断 向 量 (vectored 
interrupt) 通过 要 求 发 出 请 求 的 设备 向 处 理 器 表明 身份 来 解决 中 断 源 的 识别 问题 。 没 有 中 断 
向 量 ， 处 理 器 必须 检查 每 个 外 围 设备 的 中 断 状态 位 。 

当 处 理 器 检测 到 中 断 请 求 时 ， 它 向 所 有 可 能 发 出 中 断 请 求 的 外 围 设备 (中 断 源 ) 广播 
(broadcast) 中 断 确认 (interrupt acknowledge)。 每 个 可 能 的 中 断 源 检测 来 自 CPU 的 确认 信 
号 ,发 出 中 断 的 设备 返回 一 个 向 量 (vector), CPU 用 该 向 量 调用 相应 的 中 断 处 理 程序 。 图 
4-28 展示 了 68000 系列 如 何 实现 带 优 先 级 的 ( prioritized) 和 向 量 的 (vectored) 中 断 。 图 中 
有 7 个 级 别 的 中 断 请 求 ， 如 果 i >j 的 话 ， 第 i 级 中 断 可 以 在 第 j 级 中 断 执行 过 程 中 被 执行 。 
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BALI PRE, RAS > i 的 时 候 , 第 i 级 中 断 才 可 以 被 第 j 级 中 断 所 中 断 。 


4 级 中 断 被 5 级 中 断 所 中 断 ， 在 ”2 级 中 断 被 4 级 中 断 所 中 断 ， 
5 级 中 断 完成 后 再 完成 4 级 中 断 然后 又 被 5 级 中 断 所 中 断 






4 级 中 断 被 5 


S 
#3 
1 
Ew is 30 40 pif ? hee 110 ` - 
€ 
8 
4H 5 99. AB Naa — ONE SA AE i 
断 顺 序 
时 间 9 


栈 指针 
复位 向 量 


IRQ IACK 
IVEC 
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图 4-28 具有 优先 级 和 向 量 的 中 断 机 制 
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每 个 外 围 设备 的 IRQ 信号 输出 连接 到 7 级 中 断 请 求 IROI ~ IRQ7. 外围 设备 产生 的 中 
断 级 是 用 户 定义 的 。 优 先 级 编码 器 将 中 断 请 求 的 输入 转换 成 3 位 编码 连接 至 CPU 中 断 优先 
级 引 脚 TIPLO ~ IPL2。CPU 将 请 求 输 太 的 级 别 与 其 状态 寄存 器 中 的 中 断 屏 蔽 码 五 一 五 比较。 
如 果 中 断 屏蔽 码 低 于 中 断 的 级 别 ， 则 进行 中 断 处 理 。CPU 通过 将 功能 控制 输出 FC2，FC1 和 
FC0 设置 为 1, 1, 1 并 且 将 被 确认 的 中 断 级 别 放 到 地 址 总 线 As. A, A A, 上 以 便 进 行 中 断 确认 。 
外 部 逻辑 对 功能 编码 进行 译 码 ， 这 3 条 地 址 线 生 成 7 个 级 别 的 中 断 确认 ，IACKI ~ IACK7。 

假设 中 断 级 别 为 2 和 6 的 外 围 设 备 同 时 请 求 服 务 。 同 时 发 出 巫 Q2 A IRQ6 信号 。 优 
先 级 编码 逻辑 选择 ROG 并 发 送 代 码 6 至 CEU。 如 果 中 断 屏 项 码 被 设置 为 5 或 以 下 ，FC2、 
FC1 AI FCO 上 将 出 现 中 断 请求 信 号 : 数值 6 将 被 放 在 地 址 线 的 3 个 低位 上 上， 故 发 出 了 
TACK6 信号 。 

RA 6 级 服务 的 外 围 设备 发 现 IACK6 已 经 发 出 ， 对 中 断 确认 信号 进行 响应 ,将 其 8 
位 中 断 向 量 寄存 器 的 内 容 放 到 数据 总 线 上 。 例 如 ， 外 围 设备 可 能 将 数值 64iv 提供 给 CPU. 

CPU 读 取 来 自发 出 中 断 的 外 围 设备 提供 的 中 断 向 量 号 (interrupt vector number)， 将 其 
乘 以 4 并 形成 32 位 的 地 址 ， 范 围 从 0000i。 ~ OOFF,,. Ja CPU 使 用 该 32 位 的 值 来 索引 存 
储 器 中 中 断 处 理 程序 的 指针 表 ; 该 例 中 ， 中 断 号 64o 将 乘 以 4 变 成 010016。 该 位 置 的 内 容 代 
表 该 外 围 设备 对 应 的 中 断 处 理 程 序 的 起 始 位 置 ， 它 可 以 从 存储 器 中 读 出 然后 加 载 到 程序 计数 
器 中 。 

6. 中 断 时 间 

中 断 处 理 需要 开销 : 即 识别 中 断 与 响应 中 断 的 时 间 (中 断 延迟 ，interrupt latency)、 调 用 
对 应 中 断 处 理 程序 的 时 间 以 及 从 中 断 处 理 程序 返回 被 中 断 程序 的 时 间 。 

在 高 性 能 工作 站 环境 中 ,中 断 的 功能 可 以 通过 其 他 机 制 (例如 具有 自 处 理 器 的 专用 IO 
系统 或 者 总 线 上 的 消息 传送 机 制 ) 来 执行 。 然 而 在 垦 入 式 应 用 中 ， 处 理 器 需要 监视 许多 实时 
系统 ， 因 此 处 理 器 的 中 断 处 理 结构 往往 至 关 重 要 。 目 前 已 经 发 现 ，ARM 处 理 器 系列 实现 了 
特殊 的 快速 中 断 请 求 ( fast interrupt request, FIQ) st, 它 提供 了 具有 一 组 新 寄存 器 的 中 断 
处 理 程序 ， 节 省 了 在 中 断 处 理 开 始 时 将 工作 寄存 器 的 内 容 保存 在 栈 中 的 时 间 ， 以 及 在 中 断 返 
回 前 恢复 其 内 容 的 时 间 。 








如 果 开 始 中 断 处 理 的 时 间 为 i,.， 从 中 断 返 回 的 时 间 为 tes 执行 VO 事务 花费 的 总 时 间 
H tig ttyotters VO WEA ty (tinttyotte)o 真实 的 情况 可 能 更 加 悲观 ， 因 为 中 断 由 操作 系 
统 进行 处 理 。 因 此 ， 处 理 中 断 的 时 间 由 于 操作 系统 的 开销 可 能 会 比 由 CPU 自己 来 处 理 中 断 
要 长 得 多 。 
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4. IRQ 一 一 优先 级 为 4，IRQ 模式 ， 向 量 为 x18. 

5. 断 点 一 一 优先 级 为 5， 终止 模式 ， 向 量 为 0x0C。 

6. SWI 一 一 优先 级 为 6， 管 态 模 式 ， 向 量 为 0x08。 

7. 非法 指令 一 一 优先 级 为 6， 未 定义 模式 ,向量 为 0x04。 

ARM 将 相应 的 异常 处 理 程序 的 入 口 指令 (通常 是 分 支 指令 或 跳 转 到 实际 异常 处 理 程 
序 的 跳 转 指 令 ) TOTEE een T AE (将 指针 
初始 化 指向 引导 程序 ) A 0 x 00000000。 

前 文 曾 谈 到 ARM 2M WARS Ah BAH, POE ei 
中 的 状态 宇和 返回 地 址 。 然 后 为 当前 异常 创建 新 的 影子 (shadow) 一 一 寄存 器 f14 和 
r13。 这 些 新 的 寄存 器 在 ARM i vaneless ( banked register) > sai 
请 求 分 组 寄存 器 T8 ~ r12 以 及 r13 和 Tl4。 

处 理 器 状态 寄存 器 (PSR) 具有 两 个 中 断 控制 位 : IRQ 位 控制 启用 和 禁用 中 断 请 求 ; 
ee ee ee RE 进入 特权 模式 的 唯 
一 方法 是 通过 SWI 指令 或 异常 。 

考虑 如 下 中 断 请 求 。 在 IRQ sl EENET 中 断 请 求 。 如 果 在 
CSR 中 的 中 断 请 求 位 被 启用 ，IRQ 屏蔽 位 被 禁用 以 阻止 进一步 的 中 断 ， 中 断 才 被 处 理 。 
处 理 器 状态 寄存 器 的 当前 值 被 保存 ， aries Fe 1a 寄存 器 被 换 入 。 执 行 相应 的 中 断 处 
理 程序 ， 然 后 返回 中 断 调用 处 。 

如 果 保存 当前 f13 Se 的 值 、 光志 寺 在 以 及 重新 局 有 jesse 天 在 中 疡 处 理 和 
序 中 可 以 出 现 中 断 谈 套 。 


PC 环境 下 的 中 断 处 理 
“直面 为 PC 中 的 中 断 处 理 概述 。 早期 的 PC， 采 用 8086 这 样 的 16 位 微 处 理 器 ， 支 
持 比 68000 微 处 理 器 系列 复杂 度 更 低 的 中 断 处 理 系统 。 8086 提供 了 单个 中 断 请 求 输入 


(INTR)。 当 发 出 INTR ESE, RE MAM ERE, MEE EAH SHI 
行 , 输出 两 个 中 断 应 答 脉 冲 至 INTA 引 脚 。 ; 
1.8086 的 原始 中 断 处 理 机 制 通过 外 部 芯片 增强 ， 即 :8259A eres 断 控制 
器 (peripheral interrupt controller, PIC). PIC 与 CPU 和 PC 系统 一 起 实现 带 优先 级 和 向 
量化 的 中 断 处 理 系统 ， 如 下 图 所 示 。 meee 





| KRAMI 
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”中 断 请 求 线 IRQ0 一 IRQ7 连接 到 PIC 的 8 位 中 断 请 求 寄 存 器 (IRR)。 发 出 中 断 请 
RIR, HÈ IRR, BH, PIC 是 可 编程 的 ， 允 许 用 户 屏 项 任意 的 中 断 请 求 位 。PIC 可 以 实 
现 循环 旋转 (round-robin) 的 优先 级 使 得 各 种 中 断 级 可 以 公平 地 访问 处 理 器 ， 因 为 当 
前 被 服务 的 中 断 将 排 在 下 一 轮 仲裁 的 最 后 。 

。 ”当中 断 请 求 正 在 等 待 处 理 时 ，INT 的 输出 (连接 到 CPU 的 INTR 输入 ) 发 出 请 求 信 
号 。 当 PIC 收 到 第 一 个 来 自 CPU 的 INTA 确认 脉冲 ， 它 将 信 R 寄存 器 中 最 高 优先 级 位 
清除 ， 在 中 断 服务 寄存 器 (ISR) 中 将 相应 位 置 位 。 中断 请 求 寄 存 器 中 ， 优 先 级 最 高 的 中 
断 请 求 被 从 队列 中 删除 ， 并 传递 到 中 断 服务 寄存 器 。 剩 下 的 中 断 等 待 处 理 ， 当 前 中 断 正 
在 处 理 时 可 以 接收 另 一 个 与 之 具有 相同 优先 级 的 中 断 。 来 自 CPU 的 第 二 个 中 断 确认 脉冲 
使 PIC 将 8 位 的 中 断 号 放 到 总 线 上 ，CPU 使 用 其 调用 相应 的 中 断 处 理 程序 。 

ISR 的 某 位 ISR, 必须 被 重 置 以 表明 当前 中 断 已 完成 服务 。 用 户 可 以 选择 两 种 方式 来 
清除 ISR;。 在 自动 结束 中 断 模式 中 ,ISR 位 是 自动 清除 的 ， 在 第 二 个 INTA 脉冲 结束 时 
被 重 置 。 在 手动 模式 下 ，CPU 必须 在 中 断 处 理子 程序 结 来 时 清除 ISR 位 。 注 意 CPU 可 
”以 选择 清除 最 高 的 服务 位 或 者 指定 的 服务 位 。 PERTRA PH, placa sites 
该 被 清除 ， 因 为 它 对 应 最 近 被 应 答 和 服务 的 中 断 。 

”PIC 和 :CPU 的 组 合 完全 支持 中 断 嵌 套 。 如 果菜 中 断 请 求 的 优先 级 比 当前 正在 被 服务 
的 中 断 的 优先 级 要 低 ， 它 就 会 被 忽略 并 保持 挂 起 状态 。 但 是 如 果 发 生 了 更 高 优先 级 的 中 
BER, BOA APM EAL TAM, PME RIAMIS INTA ANEH 
Pa ae 

8259A 可 以 级 联 ， KEREEADICH SASHA LOA TE 一 个 PIC 的 
INT 输 出 ; 也 就 是 说 ， 可 以 将 8 个 PIC 与 一 个 PIC 相连 ， 这 样 就 可 以 允许 8X8=256 种 
优先 级 的 中 断 。8259A PIC 是 一 种 用 于 与 旧 的 PC 技术 相 结合 的 传统 装置 ， 如 现在 已 经 
SUNOS ES (PC BR ARATE RECT MAL) PAUTO TEEN 
- 总 线 控制 器 子 系统 进行 中 断 处 理 。 





4.3.3 直接 存储 器 访问 


VO 处 理 最 复杂 的 方式 是 采用 直接 存储 器 访问 (direct memory access，DMA)， 此 时 外 
围 设备 和 存储 器 之 间 的 数据 传输 不 需要 处 理 器 的 干预 。 实 际 上 ;DMA 使 用 了 专用 的 处 理 器 
来 执行 IO 事务 ， 它 通过 控制 系统 总 线 并 利用 总 线 完 成 外 围 设备 和 存储 器 之 间 的 数据 移动 。 
DMA 提供 了 非常 有 效 的 数据 传输 手段 ， 因 为 DMA 逻辑 专门 用 于 IO 处 理 和 传输 大 量 突 发 
数据 (例如 ，128 个 字 节 的 输入 )。 

图 4-29 描述 了 一 个 使 用 DMA 向 磁盘 传输 数据 的 系统 。DMA 控制 器 (DMA controller, 
DMAC) 控制 数据 总 线 的 访问 。 假 设 需 要 从 磁盘 拷贝 一 块 数据 至 处 理 器 的 存储 器 。DMA 控 
制 器 必须 首先 加 载 数 据 在 存储 器 中 目的 地 址 以 及 需要 被 传输 的 字 节 数 ; 也 就 是 说 ， 用 户 需 要 
在 启动 DMA 控制 器 前 对 其 进行 编程 。 在 实践 中 ，DMA 控制 器 由 操作 系统 配置 。 

图 4-29 显示 了 CPU 和 存储 器 之 间 的 地 址 和 数据 路 径 。 三 总 线 开 关 习 switch) 控制 CPU, 
存储 器 和 DMA 控制 器 对 数据 总 线 的 访问 。 总 线 开 关 (通常 是 三 态 门 ) 可 以 开启 或 关闭 以 启 
用 或 禁用 总 线 和 与 总 线 开 关连 接 的 设备 之 间 的 信息 路 径 。 通 常情 况 下 ，CPU 总 线 开 关 处 于 
关闭 状态 ，DMAC 和 外 围 设备 的 总 线 开关 处 于 打开 状态 。CPU 在 其 与 存储 器 之 间 的 数据 传 
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输 通过 将 地 址 放 到 地 址 总 线 然后 再 读 写 数据 来 完成 。 图 4-30a 说 明了 CPU 控制 总 线 的 情况 ， 
图 4-30b 显示 了 DMA 控制 器 是 如 何 控制 数据 总 线 并 进行 数据 传输 的 。 





DMA 控制 器 外 围 设备 
(DMAC) (磁盘 驱动 器 ) 


Data_req 请 求 Data_req 


Data_ack Data_ack 
DMA _req DMA_ack 


CPU 允许 DMAC 使 用 总 线 
DMAC 向 CPU 请 求 使 用 总 线 
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图 4-29 DMA 逻辑 概览 


DMA 控制 器 外 围 设备 
(DMAC) 


Data_req 


Data_ack 


Data_ack 





a) CPU 访问 存储 器 。DMA 控制 器 与 地 址 总 线 不 相连 


外 围 设备 


Data_req 


Data_ack 
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b) CPU 断 开 与 地 址 和 数据 总 线 的 连接 。DMA 控制 器 提供 地 址 ， 外 围 设 备 驱动 数据 总 线 
图 4-30 普通 周期 和 DMA 周期 中 的 数据 流 


DMA 控制 的 IO 与 多 处 理 器 (multiprocessor) 系统 之 间 没 有 本 质 区 别 。 DMA 控制 器 与 
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处 理 器 相 比 还 具有 在 外 围 设备 和 存储 器 之 间 拷 贝 数据 块 的 指令 集 。 可 以 认为 DMA 控制 器 就 
是 具有 两 种 指令 的 字符 串 处 理 器 (string processor)， 这 两 条 指令 为 MOVE string, Memory 以 
及 MOVE Memory, string, 描述 了 数据 传输 策略 后 ; 下 面 将 讨论 影响 点 对 点 数据 传输 的 一 些 
因素 ( 即 术语 和 协议 )。 


4.4 1/O 系统 的 性 能 


下 面 介绍 VO 对 计算 机 性 能 的 影响 。 由 于 计算 机 要 么 执行 计算 要 么 访问 外 围 设备 ， 执 行 
一 个 任务 所 需 的 总 时 间 可 表示 为 : 

总 时 间 =CPU 时 间 +LIO 时 间 

这 个 表达 式 过 于 简单 ， 因 为 IO 操作 通常 可 以 与 计算 操作 重 倒 。 例 如 ， 多 媒体 系统 可 以 
从 视频 录像 机 上 读 取 数 据 、 处 理 以 前 读 出 的 数据 ， 以 及 将 前 面 处 理 的 数据 存储 至 磁盘 。 

有 些 计算 机 应 用 (例如 天 气 模拟 ) 被 称 为 CPU 密集 型 (CPU intensive) 的 ， 因 为 它们 
需要 更 多 的 CPU 时 间 和 相对 少 的 IO 时间。 与 之 相反 的 应 用 称 为 IO 密集 型 (例如 ， 从 
Internet 上 下 载 电影 )。 

即使 是 最 快 的 磁盘 驱动 器 相 比 CPU 来 说 都 要 慢 若 干 数 量 级 。 此 外 ， 处 理 器 的 性 能 比 IO 
子 系统 的 性 能 增加 得 要 快 。 例 如 ， 硬 盘 的 访问 时 间 多 年 来 减 小 得 很 少 ， 而 处 理 器 的 速度 一 年 
内 可 能 增加 10% ~ 40%。 

计算 机 设计 师 对 提高 IO 的 性 能 感 兴趣 出 于 以 下 几 个 原因 。 由 于 多 媒体 应 用 的 发 展 ，1/ 
O 瓶颈 相对 来 说 越 来 越 重要 。 具 有 讽刺 意味 的 是 ， 人 们 可 以 容忍 加 载 数 据 库 、 表 格 或 文档 的 
延迟 ,但 是 对 在 播放 音乐 或 视频 时 即使 是 1/50s 的 短暂 停顿 也 十 分 在 意 。 

考虑 以 下 这 个 虚构 的 例子 。 假 定 当前 某 多 媒体 应 用 程序 是 70% 计算 密集 型 的 ， 使 用 计 
FPL 60% 的 IO 处 理 能 力 。 假 定 改进 后 新 版 本 的 应 用 程序 要 求 每 年 增加 20% 的 资源 ( CPU 
和 IO)。 计 算 机 的 处 理性 能 每 年 增加 40%, O 的 性 能 每 年 增加 4%. 在 未 来 $ 年 这 种 局 势 
将 如 何 发 展 ?” 表 4-3 给 出 了 这 种 局 势 随时 间 的 变化 。 

表 4-3 计算 机 与 1/O 能 力 和 需求 的 相对 增长 


ee er er 





在 第 二 年 ， 性 能 需求 为 84 个 单位 的 CPU 处 理 能 力 和 36 个 单位 的 IO 处 理 能 力 。 在 这 
段 时 间 里 ;计算 机 发 展 子 -CPU 具有 140 个 单位 的 计算 能 力 ， 而 WO 具有 52 个 单位 的 处 理 
能 力 。 如 读者 所 见 ， 计 算 机 的 性 能 提升 超过 对 计算 性 能 的 需求 ， 所 以 没有 问题 。 然 而 ,对 I/ 
O 系统 性 能 需求 的 增加 导致 计算 机 能 力 逐 渐 落 后 于 需求 ， 直 到 再 也 不 能 运行 该 应 用 程序 。 

绝对 、 持 续 的 数据 传输 速度 并 不 是 1O 系统 性 能 中 唯一 的 问题 。 相 比 于 计算 机 系统 中 的 
其 他 地 方 ， 延 时 (latency) MA VO 系统 性 能 的 主要 因素 。 以 中 断 为 例 ， 延 迟 包括 建立 时 间 
(中 断 调用 和 将 返回 地 址 保持 在 栈 中 从 中 断 处 理 时 间 以 及 中 断 返 回 (将 返回 地 址 弹 栈 并 恢复 


HA / Hf B 177 


系统 状态 ) 时 间 。 
假设 计算 机 的 中 断 建立 和 返回 时 间 为 工 ( 即 中 断 开销 )) 执行 指令 的 平均 速率 为 p 条 指令 
/s。 如 果 中 断 处 理 程序 具有 n 条 指令 ， 则 中 断 系统 的 效率 为 : 
100n 
p _ 100n 
rat É pL+n- 
P 


如 果 工 的 值 大 或 者 n 的 值 小 ， 中 断 机 制 的 效率 将 很 低 。 在 几乎 没有 中 断 的 系统 中 ， 这 不 
是 一 个 大 问题 。 然 而 , 在 中 断 非 常 频繁 的 系统 中 ， 例 如 财 入 式 实时 控制 器 中 ， 中 断 效 率 可 能 
在 系统 设计 中 是 一 个 主导 因素 。 

假设 计算 机 正在 处 理 来 自 磁盘 驱动 器 的 块 大 小 为 4096 字 节 的 音频 数据 。 从 磁盘 中 读 取 
数据 的 平均 速率 为 20Mb/s， 每 个 数据 块 都 需要 的 中 断 处 理 开销 为 100hs。 数 据 传输 的 效率 如 
何 ? 读 取 一 块 的 时 间 为 4096 x 8 x 0.05ps=1638.4us. RASA E 100hs 的 中 断 开 销 ， 对 应 的 
效率 为 100 x 1638.4/(100+1638.4)=94.2%。 

至 此 已 经 介绍 了 输入 /输出 的 基础 ， 下 面 将 介绍 数据 是 如 何在 内 部 子 系统 (存储 器 和 
CPU) 之 间 以 及 CPU 与 外 围 设备 之 间 移 动 的 。 
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下 面 开 始 讨论 总 线 ; 或 者 说 总 线 系列 (family of buses)， 它 们 是 所 有 现代 计算 机 的 操作 
和 性 能 的 关键 。 总 线 (bus) 这 个 术语 是 拉丁 词 “omnibus” 的 缩写 ， 其 含义 为 “为 所 有 大 
(for all)”。 总 线 就 像 高 速 公 路 一 样 可 以 由 多 个 设备 共享 使 用 。 在 计算 机 中 ， 所 有 希望 相互 通 
信 的 设备 都 使 用 总 线 。 在 介绍 连接 计算 机 和 打印 机 等 外 部 设备 的 串 行 总 线 系列 之 前 ， 本 节 首 
先 讨 论 计算 机 内 部 的 高 速 内 部 总 线 。 

图 4-31 显示 了 具有 3 条 总 线 的 计算 机 的 组 成 。 系 统 总 线 (system bus) 由 来 自 CPU 的 
地 址 、 数 据 和 控制 路 径 组 成 。 存 储 器 和 存储 器 映射 的 1O 设备 与 该 总 线 连 接 。 这 样 的 总 线 必 
须 以 其 上 最 快 的 设备 (通常 是 存储 器 ) 的 速度 进行 操作 。 系 统 总 线 证 明 一 刀 切 〈《one size fits 
all) 的 方法 并 不 适用 于 计算 机 的 设计 ， 因 为 将 低 成 本 、 低 速 外 围 设备 与 高 速 总 线 相 连 的 成 本 
效益 比 非常 低 。 稍 后 将 看 到 因为 需要 连接 低 成 本 外 围 设备 而 出 现 的 低 成 本 总 线 。 


外 围 设备 















外 围 设备 总 线 
总 线 从 设备 “总 线 从 设备 P | 
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地 址 、 数据 和 控制 信号 
图 4-31 总 线 
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本 节 将 介绍 总 线 的 组 织 或 拓扑 结构 (topology) ; 也 就 是 ， 将 描述 它们 如 何 将 功能 单元 连 
接 在 一 起 ， 不 同 的 总 线 之 间 是 如 何 互 连 的 。 还 将 讨论 使 用 总 线 在 不 同系 统 之 间 实 现 有 意义 的 
对 话 所 需 信 号 的 作用 ， 以 及 这 些 信号 的 协议 和 时 序 。 

在 具有 多 个 CPU 的 系统 中 (或 至 少 一 个 以 上 的 设备 可 以 像 CPU 一 样 启 动 数 据 传输 动作 
(initiate data transfer action))， 总 线 必须 决定 在 需要 访问 总 线 设备 中 ， 哪 个 设备 应 该 获得 访 
问 保 障 。 这 种 机 制 被 称 为 仲裁 (arbitration)， 它 是 现代 系统 总 线 的 关键 特性 。 本 节 将 介绍 总 
线 仲裁 的 基本 原理 和 实现 总 线 仲 裁 的 方法 。 

可 以 控制 系统 总 线 的 设备 被 称 为 总 线 主 设备 ( bus master), 只 能 对 远程 总 线 主 设备 发 起 
的 事务 进行 响应 的 设备 称 为 总 线 从 设备 , (bus slave). -在 图 4-31 中，CPU 为 总 线 主 设备 ， 存 
储 器 为 总 线 从 设备 。 图 4-31 FEA IO 端口 被 标识 为 总 线 主 设备 ， 这 是 因为 它 可 以 控制 总 
线 (4, DMA 数据 传输 )， 而 其 他 的 外 围 设备 被 标识 为 总 线 从 设备 ,这 是 因为 它 只 能 对 读 或 
写 访问 进行 响应 。 磁 盘 驱 动 器 和 其 控制 器 之 间 的 连接 也 被 标识 为 总 线 (bus), 这 是 因为 它 是 
一 个 代表 特殊 和 高 度 专 用 总 线 的 例子 。 在 图 中 的 一 个 方 框 中 显示 了 带 有 本 地 存储 器 和 本 地 
总 线 (local bus) 的 CPU。 某 些 计 算 机 系统 是 这 样 组 织 的 ，CPU 通过 本 地 总 线 与 位 于 相同 卡 
(card) 上 的 存储 器 系统 直接 连接 。 这 种 组 织 方式 意味 着 CPU 访问 数据 时 并 不 是 全 部 都 需要 
使 用 系统 总 线 。 

前 面 已 经 指出 个 人 计算 机 崛起 的 原因 之 一 是 其 可 以 很 方便 地 与 各 种 不 同 的 系统 相连 ， 例 
如 高 速 硬 盘 、 视 频 摄像 机 、 键 盘 或 者 鼠标 。 因 此 ， 本 节 将 介绍 一 些 外 围 设备 总 线 ， 它 们 为 处 
理 器 与 外 部 子 系统 相连 进行 了 专门 的 设计 。 这 些 总 线 包 括 SCSI 总 线 、 火 线 ( Firewire) 和 以 
太 网 (Ethernet). 

本 节 还 将 简要 提 到 计算 机 总 线 系列 中 的 一 位 无 名 英雄 : 即 插 即 用 《plug-and-play)。20 
世纪 70 ~ 80 年 代 , 将 新 的 外 围 设备 与 计算 机 相连 是 名 副 其 实 的 事 梦 。 用 户 不 得 不 关心 物理 
连接 的 详细 信息 、 计 算 机 的 硬件 配置 以 及 外 围 设备 的 硬件 配置 。 用 户 必须 指定 外 围 设备 的 地 
址 空间 、 中 断 请 求 号 、DMA 通道 、 握 手机 制 等 等 。 今 天 ， 人 们 认为 类 似 即 插 即 用 等 技术 是 
理所当然 的 ,这 些 技术 可 以 使 计算 机 和 外 围 设备 自动 协议 ,将 资源 分 配给 外 围 设备 并 使 资源 
不 与 任何 其 他 外 围 设备 的 资源 冲突 。 


4.5.1 总 线 结构 和 拓扑 


4-32 说 明了 由 CPU+ 存储 器 + 本 地 总 线 (CPU plus memory plus local bus) 组 成 的 简 
单 总 线 结构 。 地 址 总 线 、 数 据 总 线 和 控制 总 线 通常 集中 在 一 起 ， 整 个 结构 被 统称 为 总 线 (the 
bus)。 同 时 只 有 一 个 设备 可 以 将 数据 放 到 数据 总 线 上 5 在 许多 微 控 制 器 和 第 一 代 微机 中 可 以 
发 现 这 样 的 简单 结构 。 数 据 在 .CPU 和 存储 器 或 诸如 输入 /输出 设备 和 磁盘 驱动 器 的 外 围 设 
备 之 间 传 输 。CPU 可 能 永远 是 总 线 主 设备 只 有 CPU 可 以 把 数据 放 到 总 线 上 或 邀请 存储 器 
/外 围 设备 通过 总 线 提供 数据 。 注意 ”总线 主 设备 不 三 定 需要 使 用 数据 总 线 本 身 ; 它 可 以 像 
代理 那样 控制 总 线 。 . i 

图 4-32 显示 了 将 总 线 细 分 为 具体 的 总 线 : 地 址 总 线 用 来 指定 存储 器 读 写 的 位 置 ; 数据 
总 线 将 数据 从 系统 中 的 一 点 传递 到 另 一 点 ; 控制 总 线 ， 这 一 术语 并 没有 精确 定义 ， 有 时 控制 
总 线 指 的 是 在 读 或 写 周 期 中 控制 信息 流动 的 信号 ， 有 时 控制 总 线 指 的 是 完成 特定 功能 (如 中 
断 控制 或 仲裁 ) 的 完整 的 、 单 独 的 子 总 线 。 
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图 4-32 通用 总 线 的 结构 


高 性 能 计算 机 系统 ， 如 PC， 具 有 比 图 4-31 更 复杂 的 总 线 结构 。 图 4-33 展示 了 将 两 条 
总 线 通过 扩展 接口 (expansion interface) 连接 起 来 的 总 线 结构 。 这 两 条 独立 的 总 线 系统 可 能 
具有 完全 不 同 的 功能 : 一 条 可 以 优化 高 速 处 理 器 /存储 器 事务 ， 另 一 条 可 以 支持 大 量 可 接 
插 的 外 围 设备 。PC 的 扩展 总 线 本 来 是 想 允 许 低 成 本 的 外 围 设备 插入 PC 来 创建 开放 的 系统 ， 
并 提供 灵活 性 。 


VO 控制 器 MO 控制 器 





显示 控制 器 
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图 4-33” 通 用 总 线 的 结构 


45.2 总 线 的 结构 


当 两 个 实体 通过 总 线 交 换 信息 ， 其 中 一 个 会 发 起 和 控制 数据 交换 。 控 制 总 线 的 系统 被 称 
为 总 线 主 设备 (bus master)， 由 总 线 主 设备 访问 的 系统 被 称 为 总 线 从 设备 ( bus slave)。 在 任 
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何 时 刻 ， 只 能 有 一 个 活跃 的 总 线 主 设备 ， 因 为 当今 的 总 线 不 能 同时 支持 多 个 事务 。 当 总 线 主 
设备 需要 向 多 个 从 设备 广播 信息 时 ， 一 条 总 线 可 以 同时 支持 多 个 总 线 从 设备 。 这 种 描述 过 于 
简单 。 现 代 总 线 (例如 PCI BA) 使 用 分 离 事务 (split transaction) 来 提高 吞吐 率 ， 其 中 一 个 
总 线 主 设备 访问 总 线 ， 然 后 男 一 个 总 线 主 设备 可 以 在 第 一 个 总 线 主 设备 完成 事务 之 前 使 用 总 
线 。 因 而 ， 在 数据 传输 过 程 中 ;两 个 或 多 个 总 线 主 设备 可 以 处 于 活动 状态 ;它们 的 数据 传输 
过 程 是 重 全 的。 当然 ， 没 有 两 个 总 线 主 设备 可 以 在 同一 时 刻 使 用 总 线 。 

前 面 已 经 谈 到 ， 总 线 可 以 被 看 成 是 多 条 总 线 的 集合 : 地 址 总 线 用 来 指定 数据 需要 传输 的 
源 或 目的 地 址 ， 数 据 总 线 用 来 传输 数据 ， 控 制 总 线 负 责 对 总 线 上 数据 流 的 控制 进行 响应 。 控 
制 总 线 由 许多 组 件 构成 。 例 如 ， 控 制 数据 传输 的 控制 总 线 ， 潜 在 的 总 线 主 设备 使 用 它 以 获得 
对 地 址 和 数据 总 线 的 控制 ， 并 用 于 实现 中 断 处 理 机 制 。 下 面 将 更 详细 地 介绍 这 些 子 总 线 。 


PC 总 线 的 历史 

最 早 的 PC 扩展 总 线 提供 ks 8 位 数据 通路 ， 其 工作 在 现在 被 认为 少 得 可 怜 的 ， 
4.77MHz 的 时 钟 速度 下 。 后 来 在 PC 的 AT 版 本 引入 了 16 位 被 称 为 ISA 总 线 的 扩展 总 
&, 其 使 用 8.33MHz 的 时 钟 。 对 于 专业 的 应 用 程序 来 说 ， 这 还 不 够 快 ， 所 以 提出 了 另 一 
种 扩展 总 线 一 一 扩展 工业 标准 体系 结构 (extended industry standard architecture, EISA) 
总 线 。EISA 支持 32 位 数据 通路 ， 具 有 33MB/s 的 带宽 ， 其 时 钟 频率 与 ISA 总 线 的 相同 。 
EISA 并 不 是 一 个 伟大 的 成 功 ， hd i 该 总 线 主要 
| 用 于 文件 服务 器 中 。 | ad 

IBM 创建 了 一 种 名 为 IBM 微 通道 È Microchaanel) 的 专用 总 线 体系 结 tH, ATE 
是 专 有 的 ( 即 制造 商 必 须 向 IBM 支付 版 税 ) AMAR, MAKAT GRERT 
一 种 更 受 欢迎 的 、 低 成 本 、 被 称 为 VESA 的 32 位 总 线 ， 用 以 支持 高 性 能 外 围 设备 。 此 
后 不 久 ， 出 现 了 另 一 个 竞争 对 手 ，Intel 的 64 位 外 围 组 件 互 连 〈《Peripheral Component 
| Interconnect, PCI) 总 线 ， 最 终 PCI 总 线 赢得 本 总 线 标准 化 的 竞赛 。 

PCI 总 线 是 位 于 处 理 器 自己 的 总 线 和 外 国 设 备 扩展 总 线 之 间 的 一 种 总 线 。 用 户 可 以 
将 第 二 个 外 围 设备 扩展 总 线 与 PCI 总 线 相连 。 ECI 总 线 背后 的 驱动 力 是 需要 向 图 形 控制 
器 进行 非常 高 速 的 数据 传输 。 与 IBM 灾难 性 的 微 通道 体系 结构 不 同 ， Intel 将 PCI 总 线 
标准 开放 ， 外 围 设备 制造 商 可 以 发 展 PCI 系统 测 不 需要 支付 版 税 或 道 受 专利 诉讼 3 

2004 Æ, Intel 推出 了 PCIe (PCI express) 总 线 与 高 速 外 围 设备 连接 。 其 数据 传输 率 
为 250MB/s。 到 2007 # „PCIe & "Ee: 次 修订 ,可 以 支持 高 达 8G 次 /s 的 传输 
速率 (尽管 第 三 修订 的 总 线 直到 2( 年 开始 ，PCIe 总 线 成 为 
图 形 卡 的 首选 。 per | 

与 PCle 总 线 一 样 ， 在 专业 的 、 高 速 计算 机 系统 中 还 有 











其 他 的 总 线 。 这 些 总 线 被 称 
为 背 板 总 线 (backplane bus), 这 是 困 为 它们 的 运行 时 间 与 计算 机 系统 的 时 间 相同 且 所 有 

模块 (电路 卡 ) 都 插 在 它 上 面 。 与 PC 总 线 已 经 成 为 连接 CPU 的 主板 的 一 部 分 不 同 ， 这 

， 些 其 他 类 型 的 总 线 很 少 或 没有 有 源 电路 , CPU EAE AAT ee Me 

典型 的 背 板 总 线 包括 VMEbus, Multibus, NuBus 以 及 Futurebust, 5 9 : 

et 多 个 处 理 器 可 以 通过 背 板 总 线 连接 在 一 起 ， 甚 至 可 以 把 它 理解 为 一 -种 CPU 的 局 天 

A. 连接 至 这 种 总 线 的 模块 或 卡 常常 包含 其 自己 的 本 好 总 线 以 连接 术 地 友信 器 和 外 国 _ 
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1. 数据 总 线 

定义 数据 总 线 的 3 BRIG: 宽度 (width), 速度 (speed) 和 延迟 (latency)。 数 据 总 
线 的 宽度 为 一 个 总 线 周 期 (bus cycle) 内 可 以 传输 的 比特 数 。20 世纪 .70 年代 中 期 典型 的 
数据 总 线 是 8 位 宽 ， 而 今天 64 位 的 总 线 非 常 普遍 。 一 些 芯片 的 内 部 总 线 为 128 位 或 更 宽 s 





次 完整 事务 的 时 间 ， 可 能 需要 几 个 时 钟 周 期 才能 完成 。 

总 线 的 带宽 表明 其 吞吐 量 ; 可 以 用 字 节 /s 来 表示 。 显 然 ; 更 宽 的 总 线 ， 吞 吐 量 就 越 大 。 
例如 ， 如 果 将 以 100MB/s 传输 数据 的 ,16 位 总 线 的 宽度 加 倍 为 32 位 ， 它 将 形成 200MB/s 的 
吞吐 量 。 总 线 的 固有 速度 由 其 物理 性 质 ( 即 其 构建 方法 ) 和 连接 到 总 线 上 的 设备 〈 见 后 文 
“在 总 线 上 跳跃 一 一 信号 的 传输 ”)。 某 些 逻 辑 设备 能 够 以 比 其 他 设备 更 高 的 速度 操作 。 

总 线 的 延迟 为 设置 数据 传输 所 花费 的 时 间 云 在 某 设备 永远 为 总 线 主 设备 时 总 线 的 延迟 可 
能 会 很 低 ， 但 是 在 需要 传输 数据 的 设备 必须 等 待 仲裁 机 制 保障 其 总 线 使 用 权 这 样 的 系统 中 ， 
就 会 具有 长 得 多 的 延迟 。 

2. 总 线 的 速度 

假设 设备 A 在 总 线 的 一 端 传输 数据 至 总 线 的 另 一 端 。 下 面 来 看 看 设备 A 在 三 0 时 刻 初 
始 化 数据 传输 后 发 生 的 一 系列 事件 (如 图 4-34 所 示 )。 最 初 ，A 在 万 时 刻 将 数据 放 到 数据 总 
RE, HP uH A 初始 化 传输 至 数据 出 现在 总 线 上 延迟 。 数 据 在 总 线 上 的 传播 速度 约 为 光 
速 的 70% 或 1 英 斥 ns。 信号 在 总 线 上 的 实际 传输 速度 由 总 线 的 电气 特性 -( 甚 尺寸 和 导体 周 
围 物质 的 物理 性 质 ) 决定 3 这 是 材料 所 受 的 基本 限制 ,无 论 未 来 技术 如 何 改变 ， 信号 都 不 能 
以 比 光 更 快 的 速度 传播 。 减 少 传播 延迟 的 唯一 方法 是 减少 总 线 的 长 度 。。 





4 开始 数据 在 数据 在 “数据 可 以 被 采样 数据 可 以 从 总 线 上 
驱动 总 线 ”总 线 上 出 现 BAH 。 的 最 早 时 间 点 移 除 的 最 早 时 间 点 





4 处 的 信号 





I 性 

初始 延迟 ”传播 时 间 ，; “建立 时 间 ”， “保持 时 间 3 
一 次 数据 传输 所 需 的 时 间 
图 4-34 ”传输 时 序 


当 数据 达到 B 时 ， 它 必须 被 捕获 (captured)。 锁 存 和 存储 器 部 分 由 其 建立 (setup) 时 间 
和 保持 ( hold) 时 间 指 定 。 数 据 建 立时 间 友 是 数据 在 系统 B 的 输入 端 出 现 至 其 被 识别 所 花费 
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的 时 间 。 数 据 保持 时 间 t, 指 的 是 数据 被 捕获 后 在 系统 B 的 输入 端 保持 稳定 所 需 的 时 间 。 

A Se CH nT HE BR AY BT) tet, ttt. 代入 典型 的 参数 值 可 得 t= 针 1.5+2+0=7.5ns， 
对 应 的 数据 传送 频率 为 1/7.5ns=10”/7.5=133.3MHzs 32 位 宽 的 总 线 的 最 大 数据 传输 率 为 
533.2MB/s。 在 实践 中 ， 数 据 传输 需要 时 间 来 启动 ， 该 时 间 称 为 延迟 立 。 将 延迟 考虑 在 内 ， 
最 大 数据 传输 率 为 trt) 

O 通过 流水 线 (pipelining) 技术 能 够 达到 更 高 的 数据 传输 率 ， 该 技术 在 系统 B 完成 读 取 前 
一 个 数据 之 前 开始 发 送 下 一 个 数据 元 素 。 图 4-35 显示 了 将 流水 线 应 用 于 上 一 个 例子 的 情况 。 
数据 必须 在 系统 B 的 输入 端 稳定 至 少 t+, ; 然后 新 的 元 素 才 可 以 取代 以 前 的 元 素 。 流 水 
线 技术 允许 的 终极 数据 传输 率 为 1/(#+ztp)。 4 


ttt, +t, +t, 
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1858 年 ， 铺 设 了 第 一 条 横 跨 大 西洋 的 电缆 ， 长 度 超 过 3000 英 里 ， 信 号 传输 速率 远 
低 于 期 望 的 结果 (第 一 根 电 缆 在 发 出 400 条 消息 后 就 坏 了 ， 直 到 1886 年 ， 使 用 了 一 条 新 
电缆 )。 为 什么 单 根 电缆 传输 速率 出 人 意外 地 低 呢 ? 这 个 问题 被 交 给 William Thomson 教 
授 来 调查 。 他 建立 了 传输 线 理论 和 总 线 脉冲 行为 的 基础 。 读者 可 以 认为 这 就 是 电子 技术 
的 开始 。 一 开始 由 Thomson 教授 领导 该 工作 ， 后 来 变 成 由 Lord Kelvin SS 





3. 地 址 总 线 

当 CPU 访问 存储 器 时 ， 控 制 数 据 传输 的 总 线 主 设备 必须 提供 数据 的 源 或 目标 地 址 
Gaddress)。 某 些 计算 机 系统 有 明确 的 、 与 数据 总 线 并 行 王 作 的 地 址 总 线 s 例如 ， 当 处 理 器 
向 存储 器 写 数 据 ，32 位 的 地 址 总 线 在 将 数据 传递 给 数据 总 线 的 同时 将 地 址 传递 给 地 址 总 线 。 
某 些 系 统 将 地 址 和 数据 总 线 组 合 在 一 起 形成 多 路 复 用 的 地 址 /数据 总 线 来 传输 地 址 和 数据 
(其 中 数据 和 地 址 交替 使 用 总 线 )。 由 于 时 间 被 划分 为 地 址 槽 和 数据 权 ; 因此 这 样 的 总 线 被 称 
为 时 分 (time-division) 多 路 复 用 。 

图 4-36 描述 了 更 便宜 的 多 路 复 用 地 址 /数据 总 线 ， 由 于 它 需 要 更 少 的 信号 通路 和 连接 
器 ， 而 且 插 座 需 要 更 少 的 引 脚 ， 其 实现 比 传统 的 非 多 路 复 用 总 线 要 便宜 。 将 相同 的 信号 线 多 
路 复 用 为 地 址 和 数据 需要 在 线路 的 一 端 使 用 一 个 多 路 复 用 器 (multiplexer， 一 种 高 速 电子 开 
关 )， 且 在 另 一 端 需要 使 用 多 路 选择 器 ( demultiplexer)。 多 路 复 用 总 线 的 速度 要 比 非 多 路 复 
用 总 线 的 速度 慢 ， 通 常 在 更 看 重 成 本 而 不 太 看 重 速 度 时 使 用 壤 苑 其 是 当 多 路 复 用 器 和 多 路 选 
择 器 内 置 于 处 理 器 和 接口 组 件 本 身 时 更 是 这 样 。 
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图 4-36 地 址 与 数据 复 用 


非 多 路 复 用 和 多 路 复 用 的 地 址 总 线 可 以 通过 突 发 模式 ( burst mode) 来 提高 效率 ， 此 时 
可 以 把 数据 元 素 序 列传 输 到 连续 的 存储 器 地 址 。 突 发 模式 操作 可 以 用 来 支持 高 速 缓冲 存储 器 
RH. 4 Cache 从 存储 器 中 加 载 一 块 时 ， 第 一 个 字 的 地 址 被 传输 给 存储 器 。 存 储 器 根据 指定 
地 址 提供 数据 ， 紧 随 其 后 的 就 是 下 一 个 地 址 的 下 一 个 字 , 等 等 。 这 些 连续 的 地 址 可 以 由 存储 
器 生成 。 

图 4-37 展示 了 突 发 模式 寻 址 的 概念 ， 访 问 地 址 i 并 传输 数据 i ; 而 数据 计 I i+2 和 ii+3 
并 不 需要 进一步 提供 地 址 就 可 以 传输 。 
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图 4-37 突 发 模式 和 数据 


4. 控制 总 线 

控制 总 线 控制 数据 总 线 上 的 信息 流 。 图 4-38 描述 了 最 简单 的 由 两 条 线 构成 的 同步 2 
(synchronous) 控制 总 线 ， 这 两 条 线 分 别 为 数据 方向 (data-directional) 信号 和 数据 有 效 (data 
validation) A 5. 数据 方向 信号 通常 被 称 为 R/ 克 ,高 电 平 表示 读 操 作 ， 低 电 平 表示 写 操作 
(数据 传输 的 方向 由 发 起 数据 传输 的 总 线 主 设备 指定 )。 在 读 周期 中 ， 数据 流 从 总 线 从 设备 流 
向 主 设备 ; 在 写 周 期 中 ,数据 从 总 线 主 设备 流向 从 设备 。 









读 操作 时 R/W=1 
写 操作 时 R/W=0 


DAV RW 
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总 线 主 设备 





DAV 为 0 时 表示 数据 有 效 cine 
图 4-38 最 少 总 线 控制 信号 


有 些 系统 具有 独立 的 读 和 写 选 通信 号 而 不 是 复合 的 R/W 信号 。 单 独 的 READ 和 WRITE 
信号 具有 的 优点 是 它们 可 以 表示 3 种 总 线 的 状态 : 活动 的 读 状态 、 活 动 的 写 状 态 以 及 总 
线 空 闲 状 态 (READ 和 WRITE 都 为 高 电 平 )。 复 合 的 R/ 砚 信号 会 导致 模糊 状态 ， 因 为 当 
R/ 克 =0， 总 线 总 是 执行 写 操作 ; 而 当 了 R/ 殉 =1， 可 能 是 读 操 作 被 执行 也 有 可 能 是 总 线 空闲 。 

图 4-38 中 低 电 平 有 效 的 数据 有 效 信号 (data valid signal, 五 AV)- 由 总 线 主 设备 发 出 ， 指 
明 开 始 进行 数据 传输 和 

图 4-38 中 的 同步 开放 传输 机 制 是 快速 的 传输 机 制 。 总 线 主 设备 不 知道 从 设备 是 否 对 其 
访问 请 求 进行 了 正确 的 响应 。 从 设备 可 能 没有 能 力 满足 数据 的 请 求 。 因 此 ,总 线 主 设备 必须 
以 参与 数据 传输 从 设备 的 最 慢 速 度 操作 。 本 书 讨论 的 异步 总 线 将 通过 握手 【handshaking) 机 
制 来 解决 上 述 两 个 问题 。 

异步 传输 数据 需要 两 个 数据 流 控制 信号 : 数据 选 通信 号 表明 数据 已 经 准备 就 绪 ,， 数据 
确认 选 通 信号 表明 数据 已 被 读 取 。 前 文 曾 谈 到 ， 总 线 事务 有 时 不 能 完成 (例如, 主 设 备 可 能 
访问 一 个 不 存在 的 存储 器 位 置 ) 数据 有 效 选 通信 号 永远 不 会 得 到 确认 。 j 当 这 种 情况 发 生 时 ; 
主 设备 必须 在 一 个 合适 的 超时 时 间 到 达 后 终止 事务 本 身 。 通常 ， 当 主 设备 发 出 数据 有 效 信号 





O 在 需要 主 时 钟 来 同步 信号 时 ， 总 线 就 是 同步 的 。 例 如 ， 总 线 主 设备 假定 从 设备 在 数据 有 效 信 号 发 出 后 已 经 响 
应 了 nn 个 时 钟 周期 。 
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时 ， 启 动 定时 器 。 如 果 定 时 器 达到 预定 值 ， 主 设备 将 被 迫 放 弃 访 问 。 处 理 器 执行 一 个 称 为 总 
线 错 误 (bus error) 的 特殊 例外 来 调用 操作 系统 。 

下 面 看 一 个 异步 数据 传输 的 例子 一 一 处 理 器 存储 器 读 周 期 。 图 4-39 给 出 了 68020 处 理 
器 的 简化 读 周期 时 序 图 。 处 理 器 由 时 钟 (CLK) 控制 ， 最 小 的 总 线 周期 为 有 6 个 时 钟 状 态 ， 
标记 为 S0 ~ S5. 
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E 4-39 FAB eH BI 

一 旦 处 理 器 在 SO 状态 将 地 址 放 到 地 址 总 线 上 ，CPU 在 S1 状态 的 A 点 发 出 数据 选 通 
(data strobe, DS) 信号 触发 数据 传输 。 如 果 总 线 从 设备 (如 ， 存 储 器 ) 检测 到 数据 选 通 信号 ， 
当 RW 为 高 时 就 用 该 信号 初始 化 读 周期 。 

总 线 从 设备 在 状态 S2 的 B 点 发 出 DSACK (数据 选 通 确 认 ) 信和 号 作为 DS 信号 的 响应 ， 
表明 总 线 周期 可 以 持续 下 去 。 如 果 在 总 线 S3 状态 前 没有 发 出 DSACK 信和 号， 处 理 器 将 插入 
等 待 状态 (wait state)， 直 到 发 出 DSACK 信号 。 也 就 是 说 ， 时 钟 状 态 会 为 S1、S2、W、W、W、 
W、S3、S4 和 S5 (假设 总 线 从 设备 需要 额外 的 4 个 等 待 状态 来 完成 访问 )。 

在 总 线 状 态 S5 中 的 C 点， 处 理 器 将 作废 数据 选 通 信号 , 在 点 D， 总 线 从 设备 将 作废 
DSACK 信号 来 完成 异步 握手 过 程 。 

在 下 一 节 中 , 将 介绍 现代 计算 机 总 线 中 最 重要 的 一 个 方面 一 一 仲 坊 (arbitration), 4 
个 或 两 个 以 上 总 线 主 设备 争夺 控制 权时 ， 可 以 利用 该 机 制 决定 哪个 主 设备 可 以 控制 总 线 。 


4.6 总 线 仲裁 


若 某 系统 中 有 多 个 潜在 的 总 线 主 设备 通过 公共 总 线 连接 ， 则 需要 一 种 机 制 来 处 理 同时 发 
出 的 总 线 请 求 。 多 个 请 求 被 识别 且 赋 予 其 中 二 个 优先 使 用 权 的 过 程 叫 作 仲 裁 (arbitration)。 

有 两 种 方法 来 处 理 多 个 总 线 请 求 : 本 地 化 (localized) 仲裁 和 分 布 式 (distributed) 仲裁 。 
在 本 地 化 仲裁 中 ， 仲 裁 电 路 接收 来 自 竞争 的 总 线 主 设备 的 请 求 ， 然 后 决定 谁 来 控制 总 线 。 在 
分 布 式 仲 裁 的 系统 中 ， 每 个 主 设备 将 参加 仲裁 过 程 ， 且 系统 缺乏 特定 的 仲裁 者 一 一 每 个 主 设 
备 监控 其 他 的 主 设备 ， 然 后 决定 是 继续 竞争 使 用 总 线 还 是 放弃 并 等 待 一 段 时 间 。 本 节 将 描 
述 3 种 实现 这 些 技术 的 总 线 一 一 用 于 高 性 能 专业 (如 ， 工 业 控 制 ) 系统 中 的 VMEbus, AF 
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Apple Macintosh 和 几 个 专业 系统 中 的 NuBus， 以 及 PCI 总线。 


| 背 板 总 线 


VMEbus 是 一 种 异步 的 、 非 复 用 的 背 板 总 线 ， 最 初 由 Motorola、Signetics、Mostek、 
Philips 和 Thomson-EFCIS 公司 支持 ， 并 迅速 被 接纳 为 工业 标准 。1984 年 ，IEEE 批准 
VMEbus 为 IEEE 1014 总 线 。 国 际 电 工 委员 会 ( International Electrontechnical Commission, 


| IEC) 在 1982 年 开始 对 VMEbus 进行 标准 化 ， 称 之 为 TEC 821 总 线 。 


| 
| 


VMEbus 是 一 种 被 动 的 背 板 总 线 ， 所 有 模块 都 可 以 插入 ; 也 就 是 说 ， 与 PCI 总 线 不 
同 ， 它 不 包含 板 载 CPU 和 总 线 控制 器 芯片 。 最 初 的 32 位 VMEbus 现在 支持 64 位 数据 
通路 (通过 多 路 复 用 模式 使 用 地 址 总 线 )。 除 非特 别 声 明 ， 下 面 讲 的 VMEbus 规范 指 的 


| 是 非 多 路 复 用 的 VMEbus 规范 。 下 图 给 出 了 一 张 VMEbus 背 板 的 照片 。 读 者 可 以 发 现 ， 


| 该 VMEbus 背 板 提供 了 12 个 插 楷 ， 每 个 插 楼 使 用 两 个 连接 器 。 





http://en.wikipedia.org/wiki/File:-VMEbus jpg. Courtesy of Sergio Ballestrero. 


下 图 显示 的 是 某 些 PC 中 的 现代 高 性 能 主板 。 读 者 可 以 发 现 ， 大 部 分 的 计算 机 硬件 


| 位 于 主板 上 。 当 PC 首次 出 现时 ， 主板 只 是 简单 地 将 功能 模块 相连 ; 如 果 需 要 音频 输入 / 
| 输出， 用 户 需 要 购买 声卡 ， 然 后 插 进 主板 就 可 以 了 。 其 至 有 必要 为 简单 的 串 行 数据 链接 
| 购买 接口 。 图 中 的 这 块 主板 ， 使 用 Intel 的 Z77 芯片 组 ， 适 用 于 高 性 能 系统 。 它 包含 完 
| 整 的 音频 接口 、 高 速 以 太 网 链接 、 甚 至 提供 支持 HDMI 所 必需 的 还 辑 电 路 。 板 上 具有 
| PCI、PCIe # AA. USB 3.0 接口 以 及 能 够 支持 32GB 的 DDR3 DRAM HHH. EM 
| 提供 了 8 个 支持 外 部 存储 器 (包括 SSD. ne a a 
| 具有 6GBA 的 通信 和 能力 。 
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4.6.1 本 地 化 仲裁 和 VMEbus 


本 节 将 介绍 设备 如 何 请 求 总 线 和 总 线 如 何 保障 这 个 请 求 。 这 里 使 用 支持 几 种 功能 模块 类 
型 的 VMEbus 作为 例子 。 本 节 关 注 控制 总 线 的 总 线 主 设 备 ( bus master)、 请 求 总 线 的 总 线 请 
RA (bus requester) 和 将 总 线 使 用 权 授 予 总 线 主 设备 的 仲裁 者 (arbiter), URERA LJE 
于 希望 访问 VMEbus 的 总 线 主 设备 。VMEbus 通常 置 于 一 个 盒 中 ,该 盒 具有 一 些 模块 可 以 插 
ARE ORR PCI 总线 使 用 的 插 槽 ) 。 二 一 

VMEbus 的 仲裁 子 总 线 由 如 图 :4-40 所 示 的 14 条 线 组 成 。 总 线 请 求 者 使 用 BRO ~ BR3 
(总 线 请 求 0 一 总 线 请 求 3 ) 这 4 条 线 来 表明 请 求 者 相应 的 总 线 主 设备 希望 使 用 总 线 。 仲 裁 者 
使 用 4 条 应 答 线 来 授予 总 线 请 求 者 总 线 控制 权 。 另 外 两 个 线 ， 总 线 清除 (BCLR) 和 总 线 忙 
(BBSY) 控制 仲裁 过 程 。 


插 槽 1 插 槽 2 插 槽 3 ”这 些 信号 线 构成 菊 链 


ie 









| 总 线 忙 | 
amk Me 
仲裁 者 总 线 主 设备 总 线 主 设 





备 这 些 信 和 号 沿 着 
VMEbus 传输 


图 4-40 VMEbus 仲裁 信号 


VMEbus 仲裁 者 位 于 VMEbus 称 为 搬 槽 -1 的 特殊 (special) 位 置 上 。VMEbus 的 第 一 个 
位 置 必须 由 仲裁 者 占用 。 所 有 的 总 线 请 求 线 沿 着 VMEbus 传输 ， 任 何 的 主 设备 可 以 将 请 求 
放 在 这 些 线 之 一 上 。 总线 请 求 者 发 出 请 求 的 特定 级 别 由 用 户 定义 ; 也 就 是 说 ,用户 决定 4 个 
总 线 请 求 线 与 模块 的 请 求 输出 相连 。 

仲裁 者 沿 着 总 线 插 模 读 取 所 有 的 总 线 请 求 输入 ,决定 服务 哪个 请 求 ， 然 后 通过 总 线 应 答 
输出 通知 其 他 模块 其 决定 。 在 介绍 完 仲裁 总 线 如 何 操 作 后 ， 再 介绍 仲裁 者 决定 哪个 竞争 使 用 
总 线 的 主 设备 获得 总 线 的 方式 。 

VMEbus 支持 4 个 级 别 的 仲裁 。 下 面 很 快 就 会 看 到 ， 这 四 级 中 的 每 一 级 都 可 以 进一步 细 
分 。 总 线 请 求 信号 沿 着 VMEbus 传输 ， 在 插 槽 1 的 仲裁 者 处 终止 。 图 4-41 展示 了 这 些 线 、 
仲裁 者 、 一 级 总 线 请 求 者 模块 之 间 的 关系 。 

当 一 个 或 多 个 总 线 请 求 者 代表 其 相应 的 总 线 主 设备 希望 访问 VMEbus 时 ,它们 向 其 分 
配 的 请 求 线 发 出 请 求 。 例 如 ， 插 槽 3 中 的 卡 可 能 向 总 线 请 求 线 BRI 发 出 信号 ， 插 槽 3 中 的 
卡 可 能 向 总 线 请 求 线 BR3 发 出 信号 。 插 槽 1 中 的 仲裁 者 检查 所 有 的 总 线 请 求 信号 输入 ， 然 
后 决定 是 否 其 中 之 一 请 求 成 功 。 
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p 该 模块 可 以 
中 请 求 使 用 总 线 


x AY {A 0, 1,-2 
或 3。 ERY RAH 
条 总 线 请 求 或 允许 
信号 连接 到 请 求 者 





仲裁 者 接收 到 意 线 请 求 信 
号 ， 然 后 决定 哪个 请 求 者 可 人， 
以 获得 总 线 的 访问 权 允许 使 用 总 线 信 3 
图 4-41 仲裁 者 、 请 求 者 以 及 仲裁 信号 之 间 的 关系 


假如 BR2 上 的 请 求 成 功 ， 仲 裁 者 在 其 第 2 级 总 线 允 许 输出 上 发 送 一 个 总 线 允 许 消息 
(bus grant message) BR20UT。 下 面 用 BGxIN、BGxOUT 以 及 BRx 来 代表 x 级 的 信号 。 按 
FR VMEbus 文本 的 约定 ,x 代表 0 一 3 级 。 

BGx 信号 并 不 沿 着 整 条 总 线 传输 。 相 反 ，VMEbus 使 用 称 为 总 线 允 许 输 出 (bus grant 
out) 和 总 线 允 许 输入 ( bus grant in) 的 信号 链 。 在 图 4-40 中 ,BGxIN 和 BGxOUT 信号 线 是 
分 开 的 ， 在 插 槽 间 而 非 总 线 两 端 间 传 输 。 左 侧 模块 BGxOUT 信号 输出 作为 其 右 侧 的 BGxIN 
信号 输入 。 因 此 ， 一 个 模块 的 BGxOUT 信 号 与 其 右 侧 邻 居 的 BGxIN 信号 相连 接 。 图 4-40 
中 这 种 BGxIN 和 BGxOUT 信号 的 安排 被 称 为 痢 链 ( daisy-chaining)。 连 续 的 总 线 信 号 线 在 
与 其 连接 的 所 有 设备 间 按 照 两 个 方向 传输 。 菊 链 信 号 线 为 单 向 的 (unidirectional)， 沿 着 一 个 
特定 方向 从 一 端 传输 到 另 一 端 。 接 人 菊 链 的 每 个 模块 〈 即 从 其 中 接收 和 向 其 发 出 信和 号 的 模块 ) 
要 么 向 下 传递 一 个 信号 ， 要 么 向 其 发 出 一 个 信号。 

图 4-42 显示 了 这 样 一 个 系统 ， 其 插 槽 j 的 请 求 者 在 没有 其 他 设备 请 求 总 线 时 发 出 1 级 
总 线 请 求 。 当 发 出 BRIN, 1 中 的 仲裁 者 检测 到 该 信号 并 发 出 BGIOUT 信和 号， 该 信号 
一 直 传 递 下 来 ， 直 到 到 达 插 模 j。 插 模 1 中 的 仲裁 者 发 出 总 线 允 许 输 入 信号 至 插 模 2 中 的 卡 。 
ite 2 中 的 卡 收 到 总 线 允 许 输入 然后 将 其 通过 总 线 允 许 输出 传递 给 插 槽 3 中 的 卡 ， 以 此 类 
HE, 这样， 一 个 卡 从 其 左 邻 居 收 到 总 线 允 许 输入 ， 然 后 将 其 以 总 线 允 许 输出 信号 传递 给 其 右 
邻居 。 然 而 ， 某 卡 可 以 选择 终止 菊 链 信号 传递 序列 ， 不 将 总 线 允 许 信 和 号 传递 给 其 右 邻 居 ， 后 
面 马 上 会 看 到 。 如 果菜 插 权 因 为 没有 卡 插入 是 空 的 ， 需 要 提供 总 线 跳 线 ( 即 链 路 ) 使 得 合适 
的 BGXIN 传递 给 相应 的 BGXOUT 端 。 . 

请 求 者 模块 通过 在 总 线 请 求 线 BRO ~ BR3 之 一 上 发 出 信和 号 来 试图 控制 系统 数据 传输 总 
线 。 只 有 一 条 请 求 线 发 出 信号 ， 通 过 赋予 请 求 者 一 个 给 定 的 优先 级 来 选择 实际 的 信号 线 。 该 
优先 级 可 以 通过 板 上 用 户 可 选 的 跳 线 赋值 或 者 软件 来 动态 选择 。 

AM 1 中 仲裁 者 ， 在 接收 到 总 线 请 求 后 ， 在 某 条 BGxOUT 线 上 发 出 信号 ， 然 后 总 
线 允 许 信 号 沿 着 菊 链 传播 (允许 信号 的 级 别 与 赢得 当前 一 轮 仲裁 的 请 求 的 级 别 相关 )。 每 个 


从 仲裁 者 发 给 模块 的 条 仲裁 者 发 出 的 
总 线 请 求 
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BGxOUT 信号 将 到 达 下 二 个 模块 的 BGxIN。 如 果 该 模块 不 需要 访问 总 线 ， 它 将 该 信号 传递 
给 其 BGxOUT 线 。 然 而 ， 如 果 该 模块 希望 请 求 总 线 ， 它 不 发 出 其 BGxOUT 信和 号， 自己 接管 
总 线 的 控制 。 菊 链 提供 于 自动 优先 级 ,因为 后 面 的 总 线 请 求 者 接收 不 到 总 线 允 许 信号 一 一 这 
被 称 为 地 理 优 先 级 ( Sit aan ae priotitization ). 
ML i GE HMJ 
BG30UT 








总 线 请 ? 总 线 请 
仲裁 模块 线 请 求 者 线 请 求 者 


ra 


HERI j ETETETT 1 的 总 线 请 求 。 
没有 待 处 理 的 其 他 请 求 ， 仲 裁 者 允许 级 别 1 的 请 求 。 来 自 仲裁 者 的 BG1OUT 信号 为 菊 链 传输 。 
图 中 用 蓝 色 表示 直接 连接 以 显示 消息 通路 。 

@ 插 模 /中 的 请 求 者 正 发 出 级 别 1 的 总 线 请 求 。 

@ 总 线 请 求 到 达 插 槽 1 中 的 仲裁 者 。 

© 仲裁 者 决定 级 别 击 的 总 线 请 求 是 否 获得 总 线 ， 然 后 发 出 级 别 1 的 总 线 允 许 信号 。 

© 插 槽 / 中 的 请 求 者 收 到 总 线 允 许 信号 可 以 控制 总 线 。 


”图 4-42 请 求 第 1 级 总 线 


下 面 我 们 来 看 看 VMEbus 仲裁 序列 ， 并 介绍 一 些 参 与 该 过 程 的 其 他 信号。 图 4-43 提供 
T VMEbus 仲裁 过 程 的 协议 流程 图 ( protocol flowchart), 其 中 描述 了 二 次 仲裁 过 程 中 的 一 系 
WN 

图 4-43 中 ,一 开始 ， 总 线 插 槽 MY 中 优先 级 小 于 i 的 总 线 主 设备 正在 控制 总 线 。 当 前 
总 线 主 设备 发 出 总 线 忙 (BBSY) 信号 ， 该 信号 沿 着 总 线 传递 。 只 要 任何 一 个 主 设备 发 出 了 
BBSY 信号 ， 其 他 的 主 设备 都 不 能 试图 获得 VMEbus 的 控制 权 ， 即 不 能 强迫 VMEbus 上 处 
于 活跃 状态 的 总 线 主 设备 放弃 总 线 控制 权 。 

假设 在 插 模 和 中 的 总 线 请 求 者 发 出 级 别 为 i 的 总 线 请 求 。 该 请 求 级 别 比 当前 主 设备 的 要 
高 。 仲 裁 者 检测 到 新 的 更 高 级 别 的 请 求 ， 则 输出 信号 BCLR (总 线 清除 )。 来 自 仲 裁 者 的 总 
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” 线 清除 信号 通知 当前 在 插 槽 MW 中 的 主 设备 ， 另 一 个 具有 更 高 优先 级 的 主 设备 现在 希望 访问 


总 线 。 当 前 主 设备 不 必 在 规定 时 间 限 制 内 放弃 总 线 。 通 常情 况 下 ， 它 将 在 方便 的 时 候 通 过 作 
废 BBSY 信号 来 释放 总 线 。 注 意 ，VMEbus 提供 了 由 菊 链 中 的 插 模 位 置 决定 的 地 理 优先 级 和 
由 总 线 请 求 级 可 选 的 优先 级 ( 马 止 将 会 看 到 )。 
BCLR 由 向 总 线 请 求 信号 线 永久 性 地 被 赋予 固定 ( fixed) 优先 级 的 仲裁 者 驱动 。 其 他 仲裁 
机 制 ， 如 后 面 将 介绍 的 轮转 仲裁 机 制 ， 没有 固定 的 优先 级 ， 仲 裁 者 不 需要 使 用 总 线 清除 信号 。 
当 仲裁 者 检测 到 当前 主 设备 已 经 释放 了 总 线 ， 仲 裁 者 发 出 BGiOUT 信号 表示 级 别 为 i 的 
请 求 者 已 经 获得 总 线 控制 权 。 仲裁 者 只 知道 请 求 的 级 别 ， 而 不 知 它 来 自 哪个 插 槽 。 总 线 允 许 
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信号 沿 着 总 线 传 输 ， 通过 BOGIN HA, ct BGIOUT Mi. SRW RBA N 中 发 出 级 
别 i ERA TAR BAL, 消息 不 再 继续 传递 。 


FNM 中 的 板 卡 ， 揪 术 M 中 的 板 卡 ， 
i 1 中 的 仲裁 者 eMac a 


请 求 总 线 





如 果 当 前 主 设 备 的 优先 级 比 j 
低 ， 且 没有 待 处 理 的 更 高 优先 级 
的 请 求 ， 发 出 BCLR 信号 


发 出 BGiOUT 


信和 号 


等 待 发 出 BGiIN 信号 ; 使 
BBSY 信和 号 为 低 电 平 
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Al 4-43 VMEbus 仲裁 协议 流程 


相反 ,请求 者 发 出 BBSY 信号 表明 其 当前 正在 控制 总 线 。: 如 果 有 一 个 位 于 比 插 模 /入 离 
仲裁 者 更 近 的 、 级 别 为 i 的 请 求 者 也 几乎 在 同一 时 间 请 求 总 线 会 出 现 什 么 情况 ?答案 是 ,高 
仲裁 者 更 近 的 请 求 者 将 首先 收 到 总 线 允 许 信 和 号 并 控制 总 线 。 

1. 释放 总 线 

要 释放 总 线 , 请 求 者 可 能 有 两 个 选项 : 用 完 释放 (release when done,: RWD) 或 者 根据 
请 求 释 放 ( release on request，ROR)。 选 择 RWD 要 求 请 求 者 在 主 设备 停止 指示 总 线 忙 后 尽 
快 释放 总 线 ; 也 就 是 说 , . 主 设备 在 其 任务 已 经 完成 后 还 可 能 控制 总 线 ,， 从 而 导致 不 适当 的 总 
BFA. ROR 选项 更 适合 不 会 允许 赋予 主 设备 无 限 的 总 线 访问 权 这 样 的 系统 。ROR 请 求 者 
检测 4 条 总 线 请 求 线 。 如 果 它 看 到 另 一 个 请 求 者 已 经 请 求 了 服务 ， 它 就 会 发 出 BBSY 信和 号 
并 被 其 他 请 求 延 迟 。 由 于 总 线 经 常 被 主动 清除 ，ROR 选项 也 减少 了 主 设备 请 求 仲裁 的 次 数 。 

2. 仲裁 过 程 

下 面 看 一 个 仲裁 程序 的 例子 。 图 4-44 展示 了 当 两 个 具有 不 同 优先 级 的 请 求 者 请 求 总 线 
时 会 发 生 什么 事情 。 一 开始 ， 请 求 者 A 和 B 同时 发 出 其 总 线 请 求 。 请求 者 A KH BRI 信 
号 ;请 求 者 B 发 出 BR2 信 号 。 假设 仲裁 者 检测 到 了 BRI 和 BR2 都 是 低 电 平 ; 由 于 BR2 比 
BRI 具有 更 高 的 优先 级 ; 仲裁 者 将 在 插 模 二 中 发 出 BG2IN 信号 。 当 总 线 允 许 信 和 号 沿 着 菊 
链 传递 给 请 求 者 B 时; 请 求 者 B 将 发 出 BBSY 信 号 以 响应 BG2IN。 Aa, HRA B 释放 
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BR2， 并 通知 自己 的 主 设 备 现 在 可 以 使 用 VMEbus. 





仲裁 器 空闲 
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图 4-44， 仲 裁 时 序 


当 检 测 到 已 经 发 出 BBSY 信号 后 ， 仲 裁 者 作废 BG2IN 信和 号。 在 该 点 ， 由 于 BBSY 和 总 
线 允 许 信 号 是 互 锁 的 ， 因 此 BR2 和 BG2IN SHARIR, 如 图 4-44 所 示 。 直 到 检 
测 到 BBSY 信和 号 为 低 电 平 ， 才 允许 仲裁 者 作废 总 线 允 许 信 和 号。 当主 设备 了 完成 了 其 数据 传 
WW, ERA B 发 出 BBSY 信号 。BBSY 信号 作废 的 条 件 是 保持 BG2IN 为 高 电 平 ， 此 时 从 释 
放 BR2 信号 开始 至 少 延迟 了 30ns。30ns 的 延迟 保证 了 仲裁 者 不 会 将 旧 的 BR2 信号 解释 为 男 
一 个 请 求 。 请 求 者 B 将 等 待 至 少 30ns 的 间隔 时 间 后 再 释放 BBSY。 

仲裁 者 检测 到 释放 BBSY 信号 后 将 再 次 对 总 线 请 求 进行 仲裁 。BRI 仍然 是 低 电 平 有 效 ， 
此 时 为 唯一 发 出 总 线 请 求 的 信号 线 。 仲裁 者 通过 发 出 BOGIN 信号 允许 请 求 者 A 使 用 总 线 。 
请 求 者 A 发 出 BBSY 信号 作为 响应 。 当 主 设备 A 完成 数据 传输 后 ， 请 求 者 A 释放 BBSY， 
前 提 是 接收 到 BGIIN 信号 且 从 释放 BRI 信号 开始 至 少 延迟 了 30ns。 当 请 求 者 A 释放 BBSY 
后 ， 由 于 没有 总 线 请 求 ， 仲 裁 者 空闲 。 

3. VMEbus 仲裁 算法 

插 槽 1 中 的 仲裁 者 可 以 使 用 下 列 3 种 策略 来 处 理 带 优先 级 的 总 线 请 求 。 请 注意 ， 这 些 策 
略 是 建议 的 策略 ， 用 户 可 以 使 用 其 他 策略 。 

1 ) 选项 RRS (round robin select， 轮 转 选择 ) RRS 选项 为 每 个 主 设备 按照 轮转 的 方 
式 分 配 优先 级 。4 个 级 别 的 总 线 请 求 都 有 机 会 获得 最 高 优先 权 。 四 级 总 线 请 求 BRO ~ BR3， 
BR3 又 接着 BR0 被 看 成 一 个 循环 ; 也 就 是 说 , -连续 的 最 高 优先 级 的 序列 为 BRO，BR3， 
BR2, BRI, BRO, BR3, BR2, = o 在 任意 时 刻 , -四 级 中 的 一 个 被 赋予 最 高 优先 级 ， 使 
得 在 此 级 别 的 请 求 者 可 能 控制 总 线 。 如 果 当 前 具有 最 高 优先 级 的 请 求 者 不 想 使 用 总 线 ， 下 一 
级 将 被 赋予 最 高 优先 级 ， 以 此 类 推 。 例 如 ， 当 前 最 高 优先 级 为 BR2， 下 一 次 最 高 优先 级 将 为 
BRI, 

假设 某 个 请 求 者 被 允许 控制 总 线 。 当 总 线 被 释放 后 , 下 一 级 将 被 赋予 新 的 最 高 优先 级 ， 
该 循环 会 一 直 进 行 下 去 。 所 有 级 别 的 总 线 请 求 依次 成 为 最 高 优先 级 ， 不 会 落下 一 个 。 轮 转 选 
择 仲裁 是 一 种 公平 (fair) 的 方法 ， 因 为 所 有 的 主 设备 都 享有 平等 的 总 线 访 问 权 。 
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2 ) 选项 PRI (prioritized, RER) PRI 选项 为 每 个 总 线 请 求 线 分 配 优 先 级 ，BR3 (最 
高 ) ~ BRO。 每 当主 设备 请 求 访问 总 线 ;= 仲 裁 者 会 把 请 求 的 优先 级 与 当前 优先 级 进行 比较 。 
高 优先 级 的 请 求 经 常会 战胜 低 优先 级 的 请 求 。PRI 选项 并 不 是 公平 的 选项 ， 因 为 低 优先 级 的 
请 求 可 能 由 于 高 优先 级 的 设备 是 贪 茜 的 《greedy) 而 永远 得 不 到 服务 。 

3 ) 选项 SGL (single level, #AR) SGL 选项 使 用 总 线 请 求 线 BR3 提供 了 最 小 的 仲裁 
机 构 。 单 个 模块 的 优先 级 由 菊 链 -(daisy-chaining) 决 定 ， 所 以 离 VMEbus 插 槽 1 中 的 仲裁 者 
最 近 的 模块 具有 最 高 的 优先 级 。 随 着 模块 位 置 远离 仲裁 者 ,其 优先 级 逐渐 降低 。 


4.6.2 ”分 布 式 仲裁 


并 不 是 所 有 的 总 线 都 使 用 集中 的 仲裁 者 来 决定 哪些 竞争 使 用 总 线 的 主 设备 可 以 控制 总 
线 。 一 种 称 为 分 布 式 仲裁 (distributed arbitration) 的 机 制 允 许 沿 总 线 的 所 有 插 槽 依次 进行 仲 
裁 。 下 面 描述 支持 分 布 式 仲裁 的 背 板 总 线 一 一 NuBus， 这 是 一 种 具有 多 路 复 用 地 址 和 数据 线 
的 通用 同步 背 板 总 线 ， 也 称 为 ANSIIEEE STD 1186-1988。 它 在 1970 年 由 :MIT 构思 ， 后 来 
由 Western Digital 和 Texas Instruments 公司 支持 a。 Apple 在 其 Macintosh II 上 实现 了 NuBus 
的 子 集 。 

NuBus 系统 中 的 每 个 卡 都 赋予 了 唯一 的 空间 片段 ， 它 们 共同 构成 了 Nubus 的 整个 地 址 
空间 ; :也 就 是 说 ，NuBus 实现 了 地 理 寻 址 ‘( graphic addressing)a -32 位 的 NuBus 地 址 可 以 用 
十 六 进 制 YXXXXXXXi6 表示 ;其 中 六 表示 -15 个 卡 中 的 一 个 a Y=H111; 时 ,256MB 的 地 址 
空间 范围 从 F0000000iei~~ FFFFFFFFi 被 保留 并 称 为 模 空 间 ,(slot space) oi 该 槽 空间 被 分 为 
16 个 16MB WR, 每 块 与 每 个 插 槽 相关 联 。: 因 此 ,- 每 个 槽 都 有 与 之 关联 的 唯一 的 16MB 地 
址 空间 =: 并且, NuBus 不 能 支持 超过 16 PE s 

沿 着 背 板 的 每 个 插 槽 都 有 泪 已 唯一 的 识别 码 ;(ID)， 该 识别 码 通过 硬件 连接 到 背 板 。 每 
MEH ID 是 固定 的 ;由 背 板 连接 器 本 身 而 不 是 卡 决 定 。 例 如 元 如 果 将 卡 揪 进 插 槽 11， 低 
电 平 有 效 的 背 板 线 ID3 一 瑟 0 与 连接 器 相连 以 提供 数值 0100 (BI 0100 KR Ja 49 BI 1011, 
1011,=1ljo). 插 醒 标识 线 ID3 ~ ID0 并 非 沿 着 底板 传输 ， 只 是 简单 地 与 地 相连 或 与 每 个 连 
接 器 的 正极 相连 以 提供 恰当 的 插 槽 编号 。 i 3 | : 

NuBus 仲裁 

与 VMEbus 一 样 ，NuBus 支持 多 处 理 和 多 个 总 线 主 设备 。 下 面 将 解释 NuBus 是 如 何 通 
过 集 电 极 开路 问 来 实现 分 布 式 仲裁 的 NuBus 有 ;4 个 仲裁 信号 线 ARB0: 一 ARB3 和 一 个 优 
先 级 算法 : 当 一 组 模块 竞争 使 用 总 线 时 ， 具 有 最 高 ID 号 的 模块 获胜 。 未 来 的 主 设备 通过 发 
出 其 总 线 请 求 信号 RQST 开始 仲裁 。 ; 

NuBus (FRR HRE ERARA E SS. 从 O ~ Figo MRAR REE 
总 线 仲 裁 时 ; RR SS EBA PARANE, RA BUR a S RR 
者 将 停止 总 线 仲 裁 。 同 样 ， 如 果 具 有 更 高 编号 的 插 槽 希望 使 用 总 线 ， 正 在 请 求 的 插 槽 将 停止 
RBA; 也 就 是 说 ,如 果 某 卡 需 要 总 线 仲裁 ， 然 后 发 现 基 有 更 高 优先 级 的 其 他 卡 也 需要 总 
线 仲裁 , 它 就 会 回避 (back off)。 

为 了 理解 分 布 式 仲裁 是 如 何 工作 的 ， 读 者 需要 理解 集 电极 开路 ( open-collector) 门 。 到 
上 且 前 为 止 ， 本 书 描述 了 两 种 门 : 传统 的 门 ; 其 输出 不 是 0 就 是 1; 三 态 门 ,其 输出 为 0、1 
或 悬浮 (floating)。: 从 历史 上 看 ， 集 电极 开路 门 出 现在 三 态 门 之 前 ， 用 于 人 允许 多 个 设备 来 驱 
动 相同 的 总 线 。 
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图 4-45 EI T — SSS ERA a ETB h ARE OA AR 4) 
入 为 1， 内 部 晶体 管 开 关闭 合 ， 其 输出 像 一 个 正常 的 
反 向 器 被 强制 变 低 。 

当 输 入 为 0， 晶 体 管 的 开关 打开 ， 集 电极 开路 门 “ 输 入 
输出 悬浮 ， 因 为 它 与 内 部 的 高 或 低 电 位 线 断 开 。 也 就 hens ee 
是 说 ， 集 电极 开路 门 具有 低 电 平 输出 状态 和 悬浮 状态 ， 为 未 连接 (悬浮 ) 
可 以 把 总 线 拉 至 低 电 平 ， 但 不 能 把 总 线 拉 至 高 电 平 。 图 :4-45“ 集 电极 开路 门 

下 面 对 比 三 态 门 和 集 电极 开路 门 的 行为 。 用 户 可 
以 将 多 个 三 态 门 与 单个 总 线 连接 。 然 而 ， 在 每 个 时 刻 其 中 具有 一 个 门 可 以 使 用 ， 因 为 只 有 一 
个 门 可 驱动 总 线 为 低 或 高 电 平 。 用 户 同样 可 以 将 多 个 集 电 极 开路 门 与 相 一 条 总 线 连 接 。 如 果 
所 有 的 集 电 极 开 路 门 都 处 于 巧 浮 状态 ， 总 线 的 输出 也 是 悬浮 状态 〈 实 际 上 ， 通 过 上 拉 电 阻 可 
将 处 于 悬浮 状态 的 总 线 拉 到 高 电 平 )。 如 果 一 个 或 多 个 门 进 入 0 状态， 总 线 将 被 迫 进 入 0 状 
态 。 这 种 安排 有 时 被 称 为 线 或 逻辑 ( wired-OR logic)， 因 为 只 要 有 一 个 输出 为 低 电 平 ， 整 个 
输出 就 为 低 电 平 ; 用 正 逻 辑 术语 ， 线 或 (wired OR) 门 就 是 与 (AND) lo 

图 4-46 显示 了 具有 输入 对 和 输出 了 的 分 布 式 仲裁 器 的 关键 电路 。 该 电路 也 与 总 线 上 的 
一 条 仲裁 控制 线 相连 。 接 下 来 关注 的 是 电路 和 总 线 状态 之 间 的 关系 a。 首先 看 一 下 电路 输入 与 
输出 之 间 的 基本 人 逻辑 传递 函数 。 仔细 分 析 该 电路 的 逻辑 ， 会 发 现 输出 为 : 

YP. Q 






O 一 > 输出 
输出 状态 要 么 为 
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由 于 P=X 且 O=X， 因 此 


该 点 可 被 主动 拉 低 
或 者 处 于 晤 浮 状态 
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图 4-46 “分 布 仲裁 机 制 


乍 二 看 该 电路 似乎 什么 也 没有 做 ;因为 无 论 其 输入 是 什么 ， 其 输出 总 是 0s 但是; A 
为 集 电极 开路 反 相 器 的 输出 与 总 线 相连 ,如 果 访 1 ( 即 0=0 ) 该 电路 将 驱动 总 线 为 :0。 如 果 
无 的 输入 为 0; 集 电极 开路 门将 处 于 悬浮 状态 ,总 线 不 会 被 驱动 5 默认 情况 下 ， 总 线 将 通过 
电阻 被 拉 至 高 电 平 状态 。 

这 就 是 其 中 聪明 的 地 方 。 假设 六 的 输入 为 0， 总 线 为 低 电 平 ; 因为 另 一 个 设备 将 其 驱动 
为 低 电 平 。 在 这 种 情况 下 ， 集 电极 开路 门 反 相 器 的 输出 也 被 总 线 强制 为 低 s 此 时 , 与 门 的 两 
个 输入 端 都 为 0; 包 的 输出 将 为 15 也 就 是 说 , 了 的 输出 为 0; 除非 承 的 输入 为 1 且 总 线 被 驱 
动 为 低 。 这 样 就 得 到 于 一 种 机 制 ， 它 可 以 主动 地 将 总 线 驱 动 为 低 ;: 或 者 在 需要 将 总 线 驱 动 为 
高 时 检测 是 否 有 男 一 个 设备 将 驱动 总 线 为 低 。 该 机 制 成 为 分 布 式 仲裁 的 基础 。 ， 

图 4.47 显示 了 图 4-46 中 分 布 式 仲裁 器 考虑 所 有 可 能 的 输入 条 体 和 总 线 的 状态 所 进行 的 
操作 。 记 住 ， 总 线 可 以 为 悬浮 状态 :( 没 有 被 驱动 ) 或 者 主动 下 拉 至 低 电 平 。 当 其 处 于 悬浮 状 
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态 时 ， 电 阻 将 缓慢 将 总 线 拉 至 高 电 平 。 


输入 1 输入 0 


d) 总 线 处 于 .0 状态 ， 输 入 为 0， 输 
出 为 1。 反 向 器 的 输出 被 迫 为 0。 
这 是 唯一 一 种 输出 为 :1 的 情况 





e) 总 线 处 于 1 状态 ， 输 入 f) 总 线 处 于 1 状态 ， 输 入 为 0， 
为 1， 输出 为 0; 总 线 被 迫 输出 为 0 
为 0 状态 
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4-47 ”分布 仲裁 器 的 操作 


图 4-47a 和 图 4-47b 假定 总 线 处 于 悬浮 状态 没有 被 驱动 。 在 这 种 情况 下 ， 电 路 的 输出 总 
是 0， 与 它 的 输入 无 关 。 在 实际 系统 中 ， 这 个 情况 不 存在 ， 因 为 总 线 将 总 会 被 主动 拉 低 至 低 
电 平 或 者 被 电阻 缓慢 拉 至 高 电 平 。 

图 4-47c 和 图 4-47d， 考 虑 总 线 被 所 连接 的 某 设备 主动 驱动 为 0 的 情况 。 在 图 4-47c F, 
总 线 被 主动 驱动 为 低 ， 但 集 电 极 开路 门 的 状态 也 为 低 ; 所 以 集 电极 开路 反 向 器 的 输出 和 总 线 
之 间 没 有 冲突 。 电 路 的 输出 为 0。 

在 图 4-47d 中 ， 输 入 为 0， 集 电极 开路 门 的 输出 悬浮 。 然 而 ， 总 线 的 状态 为 低 ， 反 相 器 
的 输出 被 拉 低 至 低 电 平 。 电 路 的 输出 现在 为 1。 该 输出 告诉 系统 ， 另 一 个 设备 将 总 线 驱动 为 
低 ， 与 输入 矛盾 。 

图 4-47e 和 图 4-47f， 因 为 没有 其 他 设备 将 总 线 驱 动 为 低 ， 总 线 处 于 高 状态 。 图 4-47e 
是 一 个 有 趣 的 例子 。 其 输入 为 1， 集 电极 开路 门 的 输出 为 低 电 平 。 它 将 驱动 总 线 为 低 状 态 。 
此 时 ， 该 电路 驱动 总 线 ， 电 路 的 输出 为 0。 在 图 4-47f 中 ， 输 入 为 0 且 反 相 器 的 输出 为 悬浮 
状态 ， 所 以 与 总 线 的 状态 没有 冲突 。 

正如 读者 可 以 看 到 的 ， 有 两 种 特殊 的 情况 。 一 种 情况 是 ,总线 为 低 电 平 有 效 ， 但 反 相 器 
的 输出 为 高 ， 这 导致 反 相 器 的 输出 被 拉 低 。 另 一 种 情况 是 ， 总 线 为 高 状态 ， 反 相 器 的 输入 为 
低 电 平 有 效 ， 导 致 总 线 被 迫 变 为 低 状态 。 

表 4-4 总 结 了 该 电路 的 动作 。 电 路 的 输入 代表 “ 想 要 使 用 总 线 (1 want the bus)” 或 “不 
想 使 用 总 线 (1 don’t want the bus)” 状态 。 如 果 总 线 没 有 被 驱动 为 低 ， 当 电路 输入 为 1 时 ， 该 
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电路 将 驱动 总 线 为 低 5 该 电路 产生 :0 输出， 除非 其 输入 为 1 有 上 且 总 线 被 其 他 设备 主动 驱动 为 低 。 
表 4-4 4-47 中 总 线 状 态 的 小 结 


图 4-48 显示 了 NuBus 仲裁 器 的 细节 ， 该 仲裁 器 使 用 图 4-46 中 电路 的 原理 。 洪 在 的 需要 
使 用 总 线 的 主 设备 将 其 仲裁 级 别 放 至 4 位 仲裁 总 线 ID3 一 IDO 上 。 注 意 ， 图 中 只 画 出 了 仲裁 
器 4 个 阶段 中 的 3 个 阶段 。 


第 三 阶段 第 二 阶段 第 一 阶段 





















输出 为 1。 获得 总 线 ， 使 其 变 为 低 状 态 
输出 为 1。 不 想 使 用 总 线 





想 要 使 用 总 线 
不 想 使 用 总 线 









Arbitrate 







1 将 禁止 下 一 
级 ， 表 明 总 线 非 
空闲 
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V 
ID3 ID2 IDI 仲裁 总 线 
图 4-48 分 布 式 仲裁 


由 于 NuBus 使 用 负 逻 辑 ， 仲 裁 级 别 的 编号 需要 取 反 ， 故 最 高 优先 级 为 0000 而 最 低 优先 
级 为 1111。NuBnus 仲裁 的 关键 很 简单 一 一 如 果 竞 争 的 主 设备 在 总 线 上 发 现 具 有 比 自己 更 高 
的 优先 级 ， 它 就 停止 竞争 总 线 。 每 个 请 求 者 同时 驱动 仲裁 总 线 并 观察 总 线 上 的 信和 号。 如 果 它 
发 现 具有 更 高 优先 级 的 请 求 者 一 它 就 会 退出 竞争 。 

在 图 4:48 中 ,ID0 ~ ID3 信 号 线 定义 了 插 槽 的 位 置 ， 因 此 ， 主 设备 的 优先 级 以 及 
ARBO ~ ARB3 信号 都 是 仲裁 信号 线 并 沿 着 总 线 传输 。 标 志 为 Arbitrate 的 信号 允许 主 设备 开 
始 总 线 仲 裁 ， 如 果 主 设备 赢得 仲裁 将 输出 GRANT 信号 。NuBus 使 用 非 顺序 的 仲裁 逻辑 ， 仲 
裁 在 总 线 正常 活动 时 并 行 发 生 。 

假设 三 个 主 设备 的 级 别 编号 为 0100 (4)、0101 (5) 和 0010 (2)， 它 们 同时 把 代码 
1011, 1010 和 1101 分 别 放 到 仲裁 总 线 上 。 由 于 仲裁 线 是 集 电极 开路 的 ， 任 何 为 0 级 的 输 
出 将 使 总 线 拉 低 为 0。 在 这 个 例子 中 ， 总 线 将 被 迫 进入 1000 状态 。 在 第 二 阶段 的 主 设备 把 
代码 1101 放 到 仲裁 总 线 上 ， 将 检测 到 ARB2 被 拉 低 ; 结束 仲裁 过 程 。 仲 裁 总 线 当前 的 值 
为 1010。 具 有 代码 1011 的 主 设备 检测 ARBO 被 拉 低 ， 离 开 仲裁 过 程 。 仲 裁 总 线 当 前 的 值 为 
1010， 具 有 该 值 的 主 设备 获得 总 线 的 控制 权 。 

由 于 NuBus 实现 了 优先 级 仲裁 系统 ， 高 优先 级 的 揪 槽 可 以 独占 总 线 并 阻止 低 优先 级 
的 搬 槽 获得 控制 。 这 种 总 线 占用 冲突 可 以 被 延迟 (deferral) 消除 ”二 是 揪 槽 获得 了 总 线 控 
H, 然后 放弃 它 ， 该 插 槽 将 不 会 试图 重新 获得 总 线 控制 权 ， 直 到 所 有 等 待 的 总 线 请 求 已 
经 被 处 理 。NuBus 确实 具有 人 允许 总 线 主 设备 维持 其 总 线 控制 权 的 特殊 机 制 。 称 为 关注 周期 
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(attention cycle》 的 特殊 NuBus 控制 周期 ,可 以 用 来 请 求 继续 拥有 总 线 的 所 有 权 。 

上 面 介绍 了 背 板 总 线 并 描述 了 了 分布 式 Cdistributed) 和 本 地 化 ( localized) 仲裁 协议 的 例 
子 。 事 实 上 ， 在 总 线 设 计 中 有 很 多 的 变种 ， 几 乎 每 一 个 工程 师 都 梦想 着 创建 一 种 终极 总 线 ， 
就 像 所 有 的 作者 都 想 写 “ 伟 大 的 美国 小 说 (The Great American Novel)” 一 样 。 下 面 将 介绍 
更 为 复杂 的 PC 总 线 一 一 PCI 总 线 ， 及 其 衍生 物 PCI express (PCIe)。 


4.7 PCI 和 PCle 总 线 


在 介绍 PCI 总 线 之 前 ， 需 要 了 人 解 其 应 用 环境 。 最 初 的 .PC 总 线 使 用 62: 个 插头 的 连接 器 ， 
支持 20 位 地 址 总 线 ， 工 作 频 率 为 4.772MHz。 总 线 其 实 就 是 一 种 CPU 接口 的 扩展 。 表 4-5 
描述 了 最 初 的 PC 总 线 引 脚 的 功能 。 这 里 总 结 了 一 下 ， 看 看 该 总 线 是 多 么 简单 ， 它 完全 是 以 
自 组 织 (ad hoc) 方式 构建 并 没有 考虑 未 来 扩展 和 功能 提升 。 

表 4-5 第 一 代 PC 总线 信和 号 











引 脚 功能 

CLX 4.772MHz 时 钟 
OSC 14.318MHz 时 钟 
RESET 重 置 连接 至 总 线 的 设备 
SA0 ~ SA19 20 位 地 址 总 线 ，1MB 的 地 址 空间 
DO ~ D7 8 位 数据 总 线 
AEN 地 址 使 能 ， 高 电 平 有 效 ， 表 明 DMA 和 刷新 操作 
ALE 地 址 锁 存 使 能 ， 表 明 有 效 的 总 线 周期 开始 
SMEMR 低 电 平 有 效 ， 表 明 有 效 的 存储 器 读 周期 
SMEMW 高 电 平 有 效 ， 表 明 有 效 的 存储 器 写 周 期 
IOR 低 电 平 有 效 ， 表 明 有 效 的 IO 端口 读 周 期 
IOW 高 电 平 有 效 ; 表明 有 效 的 /O 端 日 写 周 期 
IOCHRDY 由 总 线 从 设备 使 用 来 扩展 总 线 周 期 
OWS ， 零 等 待 状态 ,用 来 表明 没有 等 待 状态 
IOCJCHK 奇偶 校 验 状 态 ， 用 来 表明 存储 器 错误 
DRQ1 ~ DRQ3 外 围 设备 使 用 的 DMA 请 求 线 
DACK1 ~ DACK3 CPU 发 给 外 围 设备 的 DMA 允许 信号 线 
T/C 指示 DMA 操作 的 结束 
REF 刷新 信号 ,表明 DRAM 开始 执行 刷新 周期 
IRQ2 ~ IRQ7 中 断 请求 线 

4.7.1. PCI 总线 


外 围 组 件 互 连 局 部 总 线 ( Peripheral Component Interconnect local bus, PCI bus) 代表 了 
二 种 对 PC 系统 架构 的 激进 变革 。 Intel 在 1993 年 底 设计 了 这 种 用 于 基于 Pentium 系统 的 总 
Ro PCI 总 线 不 仅 比 以 前 的 总 线 快 得 多 ; 它 还 大 大 扩展 了 PC 笨 系 结构 的 功能 。 事实 上 ,PCI 
总 线 是 PC 扩展 性 和 灵活 性 的 核心 。PCI 允许 用 户 把 卡 插 到 计算 机 系统 中 ， 通 过 增加 调制 解 
调 器 、SCSI 接 日 、 视频 处 理 器 、 声 卡 等 模块 来 增加 功能 。 更 具体 地 说 ,PCI 总 线 允 许 这 些 卡 
利用 过 众所周知 的 北桥 (North bridge) 与 CPU ÑA 总 线 接口 电路 总 称 为 芯片 组 (chipset). 
所 有 与 PCI 相连 的 PC 都 需要 这 样 的 二 个 芯片 组 。 

与 来 自 CPU 的 地 址 、 数 据 和 控制 信号 相 比 ; PCI 被 称 为 本 地 总 线 (Clocal bus) 或 称 为 局 
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MRA. BABS CPU: 直接 连接 可 提供 最 快 的 数据 传输 率 ; 5 CPU 直接 连接 的 总 线 被 称 为 
前 端 总 线 r(Cffonf side bus ) 

PCI 总 线 支 持 即 插 即 用 (plug-and- 
play) 功能 ， 插 入 的 PCI 卡 在 加 电 时 自动 
配置 ， 一 些 类 似 中 断 请 求 的 资源 被 分 配给 
即 插 即 用 卡 ， 该 过 程 对 用 户 来 说 是 透明 
的 。 最 初 的 PCI 总 线 工 作 在 33MHz， 文 
持 32 位 和 64 位 数据 总 线 。PCI 总 线 2.1 
版 本 支持 66MHz 的 时 钟 5 

PCI 总 线 通 过 单 芯 片 的 PCI 桥 (PCI 
bridge) 连接 到 PC 系统 ， 通 过 第 三 个 桥 
与 其 他 总 线 连接 。 这 样 的 安排 意味 着 具有 
PCI 总 线 的 PC 仍然 可 以 支持 旧 的 ISA 总 
Bo SR, ISA 总 线 已 经 过 时 , PCI 总 线 
也 由 PCI express 总 线 蔡 代 。 

图 4-49 说 明子 PCI 总 线 、 桥 、 处 理 器 、 存 储 器 和 外 围 设备 之 间 的 关系 。 处 理 器 直接 连 
接 到 桥接 电路 ， 人 允许 处 理 器 通过 PCI] 总 线 访问 外 围 设备 。PCI 系统 由 PCI 本 地 总 线 本 身 、 插 
入 总 线 的 所 有 卡 以 及 控制 PCI 总 线 的 核心 资源 构成 。 这 些 核 心 资源 可 以 执行 例如 对 插入 总 线 
的 卡 进行 仲裁 这 样 的 操作 。PCI 总 线 规范 清楚 地 表明 ， 北 桥 蕊 片 是 PC 的 强制 性 部 分 。 从 历 
史上 看 ,北桥 也 处 理 了 AGP 视频 接口 。 此 外 ， 将 系统 分 为 CPU、 北桥 和 南 桥 芯片 组 是 由 于 
制造 工业 的 限制 。 今 天 ， 越 来 越 多 原来 由 外 界 桥 提供 的 接口 功能 ， 现 在 由 CPU 提供 。 
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图 4-49 PCI 总 线 、 桥 以 及 处 理 器 之 间 的 关系 





PCI 连接 器 系列 oe an 
ARAB 4878 EE (32 BAGA 位 ) 以 及 电压 水 平 (5V 电 路 或 更 现代 的 3.3V 电路 ) 可 
将 PCI 连 接 器 -为 几 个 版 本 。 aR, tid OL Vets ea 
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图 4-50 显示 了 一 个 具有 PCI 本 地 总 线 和 1ISA BROW PC 的 系统 框图 。 第 三 个 桥 通常 
被 称 为 南 桥 〈 south bridge)， 将 PCI AISA 总 线 连接 起 来 。 图 4-51a 说 明了 Pentium 4, Intel 
芯片 组 以 及 PC] 总 线 之 间 的 关系 。 图 4-51b 说 明了 更 加 现代 的 Intel Core i7 处 理 器 接口 8 
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图 4-50 北桥 、 南 桥 和 PCI 总 线 


每 个 插入 PCI 总 线 的 卡 可 能 包含 总 线 主 设备 ， 能 够 通过 控制 PCI 总 线 来 控制 数据 的 流 
动 。 每 个 卡 或 具有 总 线 主 设备 功能 的 代理 〈agent) 需要 向 PCI 总 线 提供 两 个 信号 : REQ (请 
RAR) 和 GNT (从 总 线 接收 到 允许 )。 核 心 资源 ( 即 北桥 ) 负责 处 理 PCI 总 线 仲裁 和 处 理 
来 自 每 个 代理 的 REQ/GNT 信号 对 。 当 某 个 卡 上 的 设备 希望 使 用 总 线 ， 它 发 出 其 REQ 信和 号。 
所 有 PCI 卡 的 REQ 信 号 都 交 给 仲裁 者 (芯片 组 的 部 分 逻辑 ) 来 决定 哪个 卡 可 以 使 用 总 线 。 
仲裁 者 发 出 GNT 信号 输入 给 赢得 仲裁 过 程 的 卡 ， 允 许 该 卡 访问 总 线 。 

某 些 计算 机 操作 必须 为 不 可 分 割 的 〈indivisible) 操作 或 原子 的 (atomic) 操作 ; 也 就 是 
说 ， 操 作 不 能 被 打 断 。 多 处 理 器 系统 需要 该 限制 来 实现 锁定 事务 (locked transaction). (Bik 
在 不 同 地 方 的 两 个 人 几乎 在 同一 时 间 向 旅行 社 打 电话 ， 询 问 是 否 在 某 个 特定 日 期 有 从 伦敦 到 
巴黎 的 航班 。 假 设 只 有 一 个 空余 座位 。 第 一 个 人 间 的 时 候 被 告知 有 一 个 座位 。 第 二 个 人 间 的 
时 候 也 会 得 到 相同 的 答案 。 于 是 这 两 个 人 开始 预订 同一 个 座位 ， 导 致 了 冲突 的 后 果 。 通 过 使 
用 锁定 事务 ， 首 先 提出 问题 的 人 将 阻止 其 他 任何 大 访问 数据 ， 直 到 他 已 经 决定 是 否 要 预订 该 
座位 。 锁 定 总 线 也 类 似 ， 可 以 用 来 防止 两 个 处 理 器 试图 控制 同一 个 设备 。 


O 有 一 段 时 间 ，PCI 总 线 可 以 与 旧 的 ISA 总 线 连接 ， 人 允许 用 户 在 其 新 的 PC 机 中 使 用 旧 的 ISA 卡 。ISA 总 线 现 
在 已 经 过 时 。 
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图 4-52 显示 了 如 何 实现 PCI 总 线 仲裁 。REQ 和 GNT 信号 连接 至 组 成 北桥 一 部 分 的 仲 
裁 者 。 该 仲裁 者 读 取 REQ0 ~ REQ3< 上 的 总 线 请 求 输入 ， 然 后 在 GNT0 ~ GNT3 上 根据 仲 
裁 获 胜 者 返回 允许 信号 。 当 PCI 代理 需要 进行 总 线 仲 裁 时 ， 仲 裁 者 发 出 BPRI 信 号 通知 主 处 
理 器 ，PCI 代理 ( 即 优先 级 代理 ) 需要 总 线 。 


BPRI 
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4-52 PCI 总 线 上 的 优先 级 仲裁 


PCI 总 线 上 的 数据 事务 

下 面 介 绍 PCI 总 线 在 其 多 路 复 用 地 址 和 数据 线 上 传输 数据 的 方式 。PCI 总 线 通过 几 种 方 
法 来 补偿 地 址 /数据 总 线 瓶 颈 。 首 先 ; 它 可 以 以 突 发 模式 操作 ， 只 传输 一 个 地 址 ， 然 后 使 用 
地 址 /数据 总 线 传输 连续 的 数据 值 序列 。 其 次 ，PCI 总 线 支 持 分 离 事 务 (split transaction) ; 
也 就 是 说 ， 一 个 设备 使 用 总 线 时 ， 另 一 个 设备 可 以 在 第 一 个 事务 已 经 完成 之 前 访问 PCI 总 
线 。 分 离 事务 意味 着 更 有 效 地 使 用 总 线 。 最 后 ， 可 以 缓冲 连接 到 PCI 总 线 的 设备 ， 它 允许 数 
据 在 被 需要 之 前 开始 传输 。 

PCI 总 线 有 自己 的 术语 《其 中 的 一 些 与 ” 表 4-6- 数据 传输 过 程 中 使 用 的 PCI 总 线 信号 
SCSI 系统 共享 )。 行 为 类 似 总 线 主 设备 的 设备 


被 称 为 发 起 者 ( initiator); 响应 总 线 主 设备 的 设 ”_AD31 
备 被 称 为 目标 ( target)。 PCL MAN — see eA OBES 


号 列 在 表 4-6 中 。 

图 4-53 展示 了 PCI 的 读 周期 ， 其 中 发 起 一 一 一 
者 读 取 PCI 六 线 上 来 自 目标 的 数据 。 PCI 操 作 Fags 
分 为 几 个 阶段 。 该 事务 从 地 址 阶段 (address 
phase) 开始 ;其 中 发 起 者 通过 将 地 址 放 到 A/D 总 线 上 进行 目标 寻 址 。 同 时 ， 发 起 者 将 4 位 
的 代码 放 到 命令 / 字 节 使 能 总 线 上 ， 并 发 出 FRAME 信号 指示 有 效 的 地 址 和 事务 代码 。 因 
为 使 用 了 具有 双重 功能 的 命令 / 字 节 使 能 信和 号 线 (在 命令 模式 下 ) 用 于 表明 读 或 写 访问 ， 故 
PCI 总 线 不 需要 显 式 的 读 或 写 信 号 。FRAME 信和 号 一 直 有 效 直 到 发 起 者 准备 完成 的 最 后 数据 
阶段 (在 突 发 事务 中 可 能 有 多 个 数据 阶段 )。 当 目标 采样 到 下 DY 信号 , FRAME 信号 被 作废 ， 
且 目 标 发 出 TRDY 信号 ”完成 数据 阶段 。 因 为 地 址 将 从 多 路 复 用 的 地 址 /数据 总 线 上 删除 ， 
所 有 潜在 的 目标 必须 在 下 一 个 时 钟 的 上 升 沿 锁定 地 址 。 

目标 设备 对 命令 / 字 贡 使 能 上 的 地 址 和 命令 进行 译 码 。 地 址 7 数据 总 线 现在 可 供 目 标 
使 用 。 当 目标 检测 到 访问 ， 它 通过 发 出 设备 选择 DEVSEL 信号 来 申明 参与 事务 。PCI 协议 
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| 
| 
| 
规定 目标 必须 在 预定 的 时 间 内 审 请 使 用 总 线 ， 否 则 该 事务 将 被 终止 。 发 起 者 使 用 当前 命令 
O 什 入 止 开动 命令 / 字 节 使 能 总 线 ， 并 在 事务 持续 时 间 内 发 出 适当 的 字 节 使 能 信号。 这 些 字 





节 使 能 信号 允许 1 一 4 个 字 节 参加 当前 事务 。 发 起 者 发 出 其 目标 就 绪 信号 TRDY， 表 明 在 
AD31 ~ ADO 上 的 数据 是 有 效 的 。 在 该 例 中 ， 发 生 了 单个 数据 事务 (也 就 是 说 ， 当 前 事务 并 
不 是 突 发 模式 操作 )。 图 4-54 展示 了 PCI 的 读 周期 ;其 中 地 址 阶段 后 接着 3 个 数据 阶段 。 
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图 4.53 简单 的 PCI 总 线 读 周 期 


地 址 阶段 ” “数据 阶段 1 ”“” ”数据 阶段 2 ” ”数据 阶段 3 
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| 其 余部 分 的 需求 是 什么 ? 记 住 ， 系 统 的 其 余部 分 包括 设备 和 子 系统 ， 它 们 也 需要 访问 
统 总 线 以 实现 DMA 等 目的 。 下 图 说 明了 一 一 个 基于 PC 的 多 处 理 器 系统 ， 它 的 两 个 站 
器 与 处 理 器 “存储 器 总 线 连接 ，J/O 总 线 和 处 理 器 总 线 之 间 有 一 个 桥 。 
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RAD ~ AAPM SAO BARMR ASK ARREE TM, 因此 ， 
应 该 实现 一 种 公平 的 仲裁 算法 ， 即 对 称 多 处 理 《symmetric multiprocessing，SMP)。 每 
个 处 理 器 在 仲裁 过 程 中 都 使 用 单独 的 标识 符 。 当 处理 器 希望 访问 总 A, 它 向 所 有 其 他 的 
处 理 器 表明 其 编号 。 每 个 处 理 器 保持 下 一 个 (next-in-line) 计数 器 以 便 指示 哪个 处 理 器 
是 下 一 ee i 
获胜 者 在 列表 的 底部 。 

mel 并 没有 给 每 个 处 理 器 二 于 二 过 制 代码 来 未 其 身份 ， 它 采用 Nobu MATE, 
ee le Intel 将 下 一 一 不 计数 器 和 仲裁 机 制 一 
RAER ， 以 便 更 容易 设计 主板 ， 也 更 方便 为 一 一 个 或 多 个 处 理 器 提供 支持 。 
zc i 总 线 。Intel 将 4 个 处 理 器 视 为 单一 实体 

(single entity)， 络 它 一 个 “我 希望 使 用 总 线 ”(I wa bus) 优先 级 请 求 输入 ， 称 为 
_BPRI。 当 外 国 设备 希望 访问 总 线 ， 它 发 出 请 求 至 适当 者 ， 后 者 生成 BPRI 信号 至 
放弃 总 统 。4 PRE 











所 需 的 总 线 。 该 BPRI 信号 并 行 发 送 给 4 rstas, 
一 起 完成 原来 由 一 一 个 处 理 器 单独 完成 芍 工 作 。 


”一旦 处 理 器 之 一 希望 使 用 总 线 ， 它 与 其 他 处 理 器 一 起 仲裁 获得 总 线 (必须 服从 SMP 
Aaa BATARA AEAEAATER TEA Ane KENAL 
与 单个 处 理 器 ,下 图 演示 了 对 称 多 处 ' 
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Scie ice pas i ms E f 优先 级 代理 可 以 通 
ee | BRAG aad) 过 发 出 请 求 输出 来 请 
六 人 全 x Ps toe S 求 访问 总 线 的 外 围 设 

了 于 要 NF a diilit SESUL 5 i 条 > 


Fe ey ee ees oe PRS 


高 优先 级 仲裁 器 
定 哪 个 优先 级 代 
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尽管 多 核 处 理 器 当今 已 经 成 为 普遍 现象 ， 但 仍然 存在 采用 PCI BAA Pentium 处 理 器 来 
实现 多 处 理 器 系统 。 后 面 将 进一步 介绍 基于 Pentium 的 多 处 理 器 系统 。 


4.7.2 PCle BR 


PCI Express (简称 PCIe) 总 线 针 对 高 科技 应 用 环境 开发 ， 它 要 求 更 高 的 性 能 和 更 低 的 成 
本 。 其 设计 目标 是 : ETRA PCI 总 线 的 成 本 ， 利 用 现成 的 技术 (电路 板 、 连 接 器 和 电路 )， 
支持 移动 、 桌 面 和 服务 器 市 场 ， 并 与 现 有 基于 PCI 的 系统 兼容 。 因 此 ，PCI Express RAN 
实现 没有 压力 。PCIExpress 的 1.0a 版 本 在 2003 年 推出 ; 第 三 个 重大 修订 一 一 PCI Express 
3.0, F 2010 Æ 11 A AA. PCL AM PCIe 最 大 的 区 别 是 PCI Express 使 用 串 行 传输 (serial 
transmission)， 即 实现 点 对 点 数据 传输 。 : 

图 4-55 展示 了 PCI 总线 和 PCI Express RAMI ZAKS. PCI BAM T ISO 
(国际 标准 化 组 织 ) 的 开放 系统 互 连 (open system interconnection, OSI) 模型 ， 它 试图 将 所 
有 通信 系统 划分 为 7 个 抽象 层 ， 每 一 层 为 其 上 层 执行 特定 的 功能 。 层 次 化 协议 的 优势 是 任意 
一 层 都 可 以 在 不 影响 其 上 层 和 下 层 的 基础 上 被 新 技术 替换 。 例 如 ， 物 理 层 可 以 从 PCB 上 的 
铜 线 变 为 光纤 而 不 需要 改变 数据 链 路 层 或 事务 层 。 

PCI Express 协议 的 最 低层 是 物理 层 (physical layer)， 负 责 点 对 点 数据 位 的 传输 。 与 传 
统 的 PCI 并 行 数据 / 地址 总 线 不 同 PCI Express 使 用 串 行 总 线 ， 其 中 数据 沿 着 一 条 或 者 一 
对 使 用 差分 编码 的 信号 线 一 位 一 位 地 和 传输。 PCI Express 的 一 个 特别 有 趣 的 方面 是 ， 它 提供 
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了 两 条 串 行 数据 路 径 ， 每 个 方向 一 条 ,， 即 PCI Express 卡 可 以 同时 向 总 线 读 写 数据 ， 它 支持 
全 双 工 操作 。 两 条 信号 路 径 统称 为 通道 ( lane)， 并 可 以 实现 多 个 通道 。 总 线性 能 随 着 通道 数 
量 线性 增长 ， 所 以 用 户 可 以 使 用 x1 总 线 、x2 总 线 、x4 总 线 、x8 总 线 等 等 。 单 个 通道 
可 以 支持 的 峰值 数据 传输 率 为 每 个 方向 250MB/s。 如 果 用 户 使 用 双向 传输 的 16 通道 系统 ， 
总 的 有 效 数据 传输 率 是 8GB/s。 图 4-56 说 明了 通道 的 概念 。 


PCI BE PCI Express 


软件 (应 用 ) ， 


数据 链 路 层 
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rma) | | (插件 和 连接 器 ) 
图 4-55 PCI 与 PCI Express 抽象 体系 结构 


概念 上 的 数据 流 


概念 上 的 数据 流 





位 编码 器 
HIERT TERT 并 行 至 串 行 Š 
编码 器 编码 器 编码 器 £ 
, ` 
通道 0 通道 0 通道 1 通道 2 通道 3 F 
a) 单 通道 数据 传输 i b) 四 通道 数据 传输 rR? 


图 4-56 PCI Express 物理 层 传输 和 通道 
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一 般 来 说 ， 数 字 系 统 中 以 电 平 描述 的 信息 是 相对 地 或 底部 (chassis) 来 说 的 ; 也 就 是 
说 ， 大 于 3.0V 的 信号 被 解释 为 高 ， 小 于 0.3V 的 信号 被 解释 为 低 。PCI Express 使 用 两 个 信 
号 路 径 来 传输 数据 ， 导 体 之 间 的 差异 (difference) 包含 了 信息 ; 例如 ， 信 和 号 可 能 为 +TV、-V 
或 者 -V、+V9。 差 动 传输 的 优点 是 ， 它 更 加 不 容易 受到 干扰 (噪声 和 其 他 由 电容 或 者 电感 
耦合 引起 的 信号 )。 这 种 信和 号 形式 被 称 为 低 电 压 差分 信号 (low voltage differential signaling, 
LVDS)。 如 果 两 个 导体 都 接收 到 干扰 ， 它 并 不 影响 信息 ， 信 息 是 由 两 个 导体 之 间 的 差异 决定 
的 。 在 串 行 链 路 上 传输 的 比特 流 的 编码 确保 时 钟 信号 被 验 入 数据 流 ， 使 用 数据 流 可 以 恢复 时 
钟 信号 ; 这 就 意味 着 设计 者 不 必 担 心 时 钟 信号 的 分 布 以 及 由 于 信号 通过 路 径 长 度 的 不 同 而 导 
致 的 数据 和 时 钟 之 间 的 延迟 ( 当 信和 号 以 2.5 x 10°bit/s 的 速度 传输 时 需要 考虑 的 重要 因素 )。 

位 编码 被 称 为 8b/10b 编码 是 因为 每 个 需要 传输 的 8 位 数据 以 10 位 进行 传输 ， 这 是 为 了 
平衡 传输 的 1 和 0 的 数量 来 保证 时 钟 信号 可 以 从 数据 信号 中 恢复 过 来 。 关 于 8b/10b 编码 的 
进一步 的 细节 参见 文本 框 “8b/10b 编码 ”。 


串 行 传输 和 并 行 传输 
E 人 
KG, FHMEAM AAG ABRORAA, 该 系统 设计 用 来 使 用 摩 斯 电码 向 世界 各 地 
发 送 消息 。 后 来， 事 行 电报 让 位 于 束 行 电话 连接 。 计算 机 基本 上 在 处 理 器 和 慢 志 外国 设 
Ae (如 打印 机 ) 之 间 使 用 囊 行 数据 连接 传输 信息 。 ; 

MÉRGES, THMSRLARR, PAT RRALRMHRRHTRR, AM 
PBNA HITEM mE ETH it mm ARR mie, 然而， 目前 在 硬盘 驱动 器 上 使 用 
的 囊 行 ATA RR, USB 和 火线 (firewire) 总 press 总 线 一 一 这 些 总 线 都 使 用 
囊 行 传输 。 4 

当然 ， 因 为 总 线 的 设计 和 连接 器 的 成 本 ， PAM EMR TES Rin, 在 
数据 传输 中 还 涉及 其 他 更 微妙 的 因素 。 首 先 ， 总 线 连 线 的 工作 类 似 天 线 ， 既 在 数据 沿 着 
总 线 传输 时 辐射 信息 ， 也 接收 来 自 相信 总 线 连 线 上 的 信息 (FI). ALRRK OH 
下 ， 电 磁 干扰 问题 变 得 十 分 严重 一 a a 
品行 总 线 只 需要 两 条 传输 线 ， 这 使 得 它 = z 

高 速 并 行 总 线 遇 到 的 另 一 个 问题 是 
据 线 ， 这 些 数 据 沿 着 总 线 传输 给 32 个 接收 器 
器 上 不 同 的 延迟 ， 这 32 位 数据 并 









bt RAMS 、- 信 号 传播 路 径 和 接收 
eta Aisa 






perce UN TS ine 
当然 ,在 数据 和 时 钟 (需要 时 钟 将 数据 流 分 解 成 单个 比特 ) 之 间 也 可 能 出 现 扭曲 。 然而 ， 
许多 站 和 数据 传输 系统 实现 申 行 雪 毛纺 ENTE EAR RR EER 





O LVDS 数据 路 径 使 用 电流 开关 。-+3.5mA 或 =3;5mA 的 电流 从 发 送 端 注 和 总线。 在 总 线 的 远 端 ， 有 一 个 1000 
的 终端 电阻 。 根 据 欧姆 定律 5=IJR， 导 线 的 两 端 电 压 为 350mV。 
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事 行 通道 也 是 半 双 工 的 ， 它 很 容易 提供 两 个 串 行 通道 ， 每 个 方向 一 个 ， 但 实现 全 双 工 伟 
输 可 以 同时 完成 两 个 方向 的 传输 。 

= 有 意思 的 是 ， PCI express 总 线 为 囊 并 行 提供 了 最 好 解决 方案 。 它 提供 了 一 对 囊 行 通 
ae 可 以 以 非常 高 的 信号 速度 实现 全 双 工 功能 。 此 外 ， 它 还 允许 使 用 多 个 通道 (每 个 通 
” 道 由 两 个 囊 行 通道 组 成 ) 来 实现 有 效 的 并 行 总 线 。 

最 后 ,并行 总 线 数据 传输 协议 和 辅助 功能 (例如 总 线 仲裁 和 中 断 处 理 ) 需要 复杂 的 
控制 结构 。 冲 行 总 线 被 迫 采取 一 刀 切 的 策略 ， 所 有 的 功能 都 以 囊 行 信息 传输 而 不 需要 额 
外 的 控制 线路 。 


PCle 数据 链 路 层 

在 详细 介绍 数据 链 路 层 之 前 ， 有 必要 描述 PCIe 总 线 (或 通过 其 他 具有 分 层 协议 的 串 行 
总 线 ， 包 括 Internet 本 身 ) 上 传输 数据 的 格式 。 在 支持 分 层 协议 的 系统 上 传输 的 数据 看 上 去 
有 点 像 俄罗斯 套 娃 的 多 层 封装 。 在 链 路 的 一 端 ， 应 用 程序 发 出 数据 包 并 用 分 隔 符 包 装 。 然 
后 ， 应 用 层 将 数据 包 交 给 男 一 层 (如 ， 数 据 链 路 层 )， 该 层 然后 再 用 自己 的 终止 符 封装 数据 。 
数据 链 路 层 将 数据 传递 给 物理 层 ， 在 该 层 也 增加 了 开始 和 结束 标志 。 当 传输 数据 时 ， 消 息 的 





两 端 具有 3 个 标志 一 一 每 层 添加 一 个 标志 。 图 4-57 展示 了 使 用 三 层 或 三 级 系统 封装 的 概念 
图 。 每 个 协议 层 为 传递 给 下 一 层 的 信息 添加 一 个 头 部 和 尾部 。 同 样 ， 每 一 层 将 传递 给 上 一 层 
的 消息 去 除 头 部 和 尾部 。 


需要 被 传输 的 数据 


应 用 层 封 装 数据 


链 路 层 封装 数据 





物理 层 封装 数据 





© Cengage Learning 2014 


Al 4-57 :消息 封装 


图 4-58 展示 了 PCIe 总线 的 消息 结构 。 最 高 层 为 事务 层 (transaction layer)， 由 头 部 和 实 
际 消息 本 身 组 成 。 头 部 定义 了 数据 消息 的 性 质 ， 例 如 数据 的 地 址 信息 《后 面 将 更 详细 地 讨论 
头 部 的 内 容 )。 事 务 层 的 尾部 为 错误 检测 码 (error-detecting code，ECRC)。 事 务 层 提供 4 个 
地 址 空间 : 存储 器 、I/O、 配 置 和 消息 空间 (message space)。 消 息 空间 这 个 术语 指 的 是 执行 
控制 功能 的 消息 集合 ， 即 总 线 操作 被 指定 为 命令 的 编码 (就 像 CPU 的 操作 码 )， 而 不 采用 专 
门 的 控制 线路 。 消 息 空间 用 来 支持 中 断 和 复位 (以 及 所 有 其 他 形式 的 硬件 管理 )。 通 过 使 用 
消息 空间 ， 像 VMEbus 或 者 NuBus 那样 的 总 线 物理 控制 线 不 是 必要 的 。 
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图 4-58 PCle 总 线 的 串 行 数 据 结 构 


8b/10b 编码 ix 

i SPA Gee a 
的 数据 编码 /解码 机 制 ( 由 IBM 的 Widmer 和 Franaszek 在 1983 年 提出 )。 每 个 字 贡 需 - 
要 额外 的 两 位 (或 者 说 宛 余 25%) 从 而 提高 了 传输 机 制 的 性 能 。10 位 代码 限制 包括 5 个 
14540, 或 者 4 个 1 和 6 个 0; 或 者 6 个 1 和 4 个 0。 这 样 可 以 确保 不 会 出 现 一 长 囊 
的 1 或 者 0。 此 外 ， 使 用 称 为 运行 偏差 (Running Disparity) 的 机 制 ， Rises aces F 
同 数 量 的 1 和 0; 这 对 于 信号 中 没有 直流 分 量 的 情形 是 必要 的 。 | 这 

8b/10b 编码 算法 通过 一 个 8 位 的 字 节 来 进行 操作 ， OR e 
这 两 组 分 别 进行 编码 ，5 位 的 组 成 为 6 位 的 编码 ，3 位 的 组 成 为 4 位 的 编码 。 这 两 个 编 
码 通 过 重新 排列 合并 成 一 个 10 位 的 编码 。 注 意 ， 除 了 该 算法 生成 的 256 ee 
还 有 12 个 代码 被 保留 以 实现 控制 功能 。 





数据 链 路 层 添加 的 头 部 包括 来 自 事务 层 的 帧 的 序号 ， 并 附加 一 个 循环 宛 余 校 验 (cyclic 
redundancy check, CRC) 用 来 保证 数据 链 路 层 的 错误 检测 ; 也 就 是 说 ， 如 果 数 据 链 路 层 的 
帧 上 的 任何 信息 被 损坏 ,该 错误 会 被 检测 出 来 并 要 求 重 传 。 数 据 链 路 层 只 有 在 知道 有 一 个 可 
用 于 接收 报 文 的 缓冲 区 时 才 发 送 报 文 ， 这 样 就 可 以 避免 因 丢 失 包 而 重 传 (这 是 早期 串 行 数据 
链 路 协议 ， 如 HDLC， 的 共同 特征 )。 

PCIe 总 线 上 数据 交换 的 规范 是 比较 复杂 的 。 图 4-59 给 出 了 包含 12 或 16 字 节 的 数据 包 
报头 的 一 般 结 构 。 正 如 读者 所 看 到 的 ， 它 包含 11 个 字段 (两 个 留 给 将 来 使 用 )。 该 结构 意味 
与 传统 总 线 相关 的 所 有 硬件 开销 (仲裁 、 中 断 、 握手， 等 等 ) 变 为 见 余 的 ， 代 价 是 增加 了 延 
迟 和 由 于 数据 开销 带 来 的 效率 降低 。 


12 或 16 
字 节 
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4.7.3 CardBus, PC 卡 和 ExpressCard 


就 像 台式 计算 机 的 发 展 那样 ， 便 携 计算 机 也 在 发 展 。20 世纪 90 年 代 笨重 的 可 移动 计算 
机 导致 了 笔记 本 和 上 网 本 的 出 现 。 上 网 本 本 身受 到 了 非 传统 计算 机 、 平 板 电脑 等 挑战 。 这 种 
进化 需要 相应 的 大 容量 存储 器 技术 、 性 能 和 能 耗 有 效 的 处 理 器 技术 、 低 功 耗 和 高 分 辩 率 的 显 
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示 技 术 ， 以 及 接口 技术 的 发 展 。 本 节 将 介绍 接口 是 如 何 发 展 以 允许 小 的 外 部 设备 与 计算 机 系 
统 总 线 相 连接 的 。 虽 然 这 些 接口 可 以 用 于 台式 电脑 ， 它 们 主要 用 于 笔记 本 。 过 去 的 上 网 本 计 
算 机 一 般 来 说 不 属于 这 个 组 。 首 先 ， 它们 太 小 ， 不 足以 支持 所 描述 的 接口 类 型 。 其 次 ， 在 我 
看 来 ,设计 专用 接口 是 一 种 退步 (例如 ，Apple iPad MHA). Ba, WiFi 的 使 用 允许 无 线 
互 连 。 接 下 来 介绍 基于 PCI 的 计算 机 的 接口 ， 然 后 是 基于 PCI express 计算 机 的 接口 。 

引入 CardBus 和 插入 该 总 线 的 PC 卡 极 大 地 增强 了 笔记 本 电脑 的 功能 。 简 而 言 之 ， 
CardBus 是 用 于 笔记 本 电脑 的 一 个 种 扩展 总 线 ， 它 允许 用 户 插 入 小 的 、 信 用 卡 大 小 的 模块 至 
笔记 本 电脑 。 这 些 模 块 提 供 了 丰富 的 功能 ， 从 微小 硬盘 至 无 线 LAN 适配器 ， 再 到 基于 卫星 
的 全 球 定位 系统 。 当 然 ， 几 乎 与 设计 和 制造 外 部 设备 的 速度 相同 ， 它 们 从 计算 机 的 外 部 进入 
计算 机 的 内 部 。 例 如 ， 所 有 的 笔记 本 电脑 和 上 网 本 现在 都 包括 内 置 的 WiFi， 甚 至 在 某 些 笔 
记 本 电脑 中 3G 无 线 连接 现在 已 经 成 为 标 配 。 计 算 机 中 将 包含 GPS 以 与 GPS 手机 竞争 。 

PCMCIA (Personal Computer Memory Card International Association) 是 非 营 利 性 个 人 
计算 机 存储 卡 国际 协会 的 注册 商标 ， 该 协会 是 一 个 贸易 协会 ,以 促进 PC 卡 技术 、 创 建 技术 
标准 、 并 提供 信息 2?。 一 些 文献 将 PC 卡 认为 是 PCMCIA 卡 ， 但 从 技术 上 讲 这 是 不 正确 的 ， 
这 是 因为 PCMCIA 是 贸易 协会 而 不 是 卡 。PC 卡 提 供 的 典型 功能 包括 : 

© A/D 转换 和 数据 采集 

e CD-ROM 接口 

e 手机 接口 

© 以 太 局 域 网 适配器 

© GPS 《全 球 定 位 系统 ) F 

o 红外 无 线 局 域 网 适配器 

。 操纵 杆 接口 

o 存储 器 (包括 Flash, SRAM 和 硬盘 驱动 器 ) 接口 

o 调制 解 调 器 和 以 太 网 组 合 卡 

o 调制 解 调 器 和 ISDN F 

o 无 线 局 域 网 适配器 

e SCSI 适 配器 

CardBus 是 1996 年 由 PCMCIA 制定 的 32 位 总 线 标准 ， 主 要 用 于 便携 计算 机 和 笔记 本 
电脑 。 它 已 经 为 低 功率 和 热 插 拔 《hot swapping) 进行 了 优化 。 一 般 来 说 ， 用 户 配 置 好 台式 
计算 机 后 就 保持 不 变 了 。 然 而 ， 由 于 笔记 本 电脑 的 功 耗 要 求 十 分 苛刻 ， 用 户 不 希望 负担 不 
会 被 使 用 的 功能 。 例 如 ， 假 设 用 户 有 一 台 笔 记 本 电脑 ， 和 希望 从 CD 安装 一 个 程序 ， 然 后 再 上 
网 。 先 将 CD-ROM 卡 插入 并 加 载 程序 ， 然 后 取出 该 卡 ， 插 和 调制解调器 卡 。 如 果 每 次 换 卡 
都 必须 断 电 再 重启 ， 用 户 将 一 直 等 待 。 热 插 拔 技术 允许 用 户 在 带电 的 情况 下 拔 掉 卡 并 搬 人 新 
的 卡 。 从 电 的 角度 来 说 ， 这 不 是 一 项 简单 的 工程 任务 。 

虽然 CardBus 必须 与 其 他 现代 总 线 接口 (如 USB 总 线 和 火线 ) 相 竞 争 ， 它 确实 有 一 个 
显著 的 优势 。CardBus 的 连接 器 既是 接口 又 是 设备 扩展 槽 (device bay). PC 卡 插 槽 可 以 巧妙 
地 隐藏 复杂 的 插入 功能 ， 而 不 需要 太 多 的 外 围 设备 接 插 线 或 者 外 部 电源 。 一 些 制造 商 已 经 在 
USB 上 采用 了 这 种 方法 ,使 其 适应 具有 扩展 的 USB 插头 〈 例 如 安全 设备 和 闪存 系统 ) 的 一 


© PCMCIA 从 2009 年 不 复 存 在 ， 因 为 ExpressCard 从 2007 年 开始 已 经 取代 了 PC 卡 。 
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些 系统 5 














PC 卡 历史 JoL GE 

PC 的 所 有 其 他 方面 几乎 相同 的 是 CardBus 也 发 展 进 化 了 eer ry rr 
计算 机 基于 ISA 总 线 实现 PCMCIA +F, 速率 为 8.33MB/s。1985 年 ， 日 本 电子 产业 发 展 
+ (Japan Electric Industry Developm ociation, JEIDA) 开始 PC 卡 技 术 的 标准 
化 过 程 ， 到 1990 年 发 布 了 4 个 规范 际 协会 (PCMCIA) 成 立 于 
1989 年 ， 由 多 家 公司 联合 对 存储 卡 进行 n 

20 世纪 90 年 代 中 期 ， 发 布 了 PCMCIA 1.0 标准 。 ig ea 68 个 引 脚 的 电气 接 
| 口 ， 以 及 I 型 和 开 型 PC 卡 的 形状 因子 。 卡 的 形状 因子 及 其 68 针 的 连接 器 最 开始 于 1985 
年 由 JEIDA 定义 。 原 标准 是 设计 用 来 > 。 到 1991 年 9 月 底 ，PCMCIA 
标准 更 新 到 2.0 版 本 ， 它 扩展 了 68 准 2.0 添 加 了 对 双 电 压 存储 
卡 的 支持 。 到 1991 年 年 底 ， 发 布 的 和 增强 的 软件 接口 。 

接 下 来 的 升级 是 在 1993 年 年 中 ，- 软件 接口 和 卡 信息 结构 (Card 
Information Structure，CIS)。1995 年 ，P Ty 出 现 了 PC 卡 标 准 。 该 标准 
要 求 每 个 PC 卡 上 都 具有 卡 信息 结构 。1997 年 ， 在 便携 计算 机 上 实现 了 32 位 33MHz 总 
线 的 PCMCIA 5.0( 它 允许 以 132MB/s 的 速度 进行 32 位 数据 传输 )。 

CardBus 卡 配置 软件 被 称 为 卡 套 接 字 服务 (Card and. Socket Service)， 通 过 自动 
Ape RR TRAE DE PP BP Hoh Ak SX, AMAPERAM ER 

和 重启 的 情况 下 更 换 卡 。 套 接 字 服 序 的 组 成 部 分 也 可 以 内 置 在 
BIOS 中 。 卡 服务 软件 层 是 一 个 位 用 编程 接口 。 该 API 允许 用 户 
在 PC 卡 内 部 集成 Internet ZA — fa 






























1. CardBus 卡 


所 有 的 CardBus PC 卡 都 通过 68 针 连 接 器 连接 主机 系统 。 卡 被 金属 保护 层 封装 以 提高 其 
信号 完整 性 。 旧 的 PC 卡 有 以 ISA 总 线 速度 工作 的 8 位 或 16 位 的 接口 。CardBus 提供 了 以 
频率 高 达 33MHz 和 峰值 带宽 为 132MB/s 工作 的 32 位 多 路 复 用 地 址 和 数据 通路 (64 位 PCI 
总 线 提供 的 频率 为 66MHz， 峰 值 带 宽 为 528MB/s)。 

CardBus 数据 传输 协议 实际 上 与 PCI 总 线 一 样 。 尽 管 早期 的 PCMCIA 设备 只 能 作为 总 
线 从 设备 ，CardBus 支持 总 线 主 设备 ， 这 消除 了 所 有 对 其 功能 的 限制 a A CardBus 和 了 CI 
总 线 共享 相同 的 协议 ， 在 它们 之 间 可 以 相对 容易 地 构造 一 个 接口 。 

虽然 CardBus 和 PCI 接口 和 协议 非常 相似 ,为 了 使 CardBus 支持 老 的 PCMCIA 卡 ， 其 
接口 和 协议 还 是 有 一 些 差异 。 例 如 ，CardBus 指定 的 电气 接口 不 支持 高 速 信号 .( 即 信号 上 升 
沿 和 下 降 沿 大 于 1V/Ans)。 由 于 功 耗 与 时 钟 频率 相关 ，CardBus 支持 时 钟 频率 的 软件 控制 。 当 
卡 首先 插入 时 检查 卡 的 需求 然后 再 调整 电压 ， 通 过 这 种 方法 实现 5V 或 3.3V 的 双 电 压 操作 。 
CardBus 标准 已 经 为 将 来 的 版 本 中 进一步 降低 工作 电压 进行 了 预先 准备 。 

2. ExpressCard 卡 

相对 于 约 2005 年 出 现 的 新 一 代 高 机 动 性 、 轻 便 的 笔记 本 电脑 来 说 , PC 卡 是 很 大 
的 。2003 年 ， 出 现 了 被 称 为 ExpressCards、 以 2.5Gb/s 工作 的 一 系列 卡 。2009 年 出 现 了 
ExpressCard 2.0， 最 大 传输 速率 为 500MB/s。 图 4-60 显示 了 两 个 ExpressCard 以 及 CardBus 
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卡 。 每 个 ExpressCard 都 有 相同 的 连接 器 接口 : 一 个 版 本 为 34mm 宽 ， 另 一 个 为 54mim 宽 ， 
有 趣 的 是 ，ExpressCard 支持 两 种 接口 : PCI express 总 线 接口 和 USB 2.0 串 行 总 线 接口 。 
ExpressCard 标准 规定 主机 系统 应 该 能 够 支持 3.3V、1000mA， 辅 助 的 3.3V、250mA， 以 及 
500mA、1.5SV。 使 用 USB 总线 ( 见 后 ) 时 ， 该 电流 可 以 驱动 ExpressCard 模块 。 


34mm 


ExpressCard | 34 26 针 


ExpressCard | 54 fe 26 tt 


54mm 





22mm 


54mm 


CardBus PC 卡 i 68 针 
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85.6mm 
图 4-60 ExpressCard 外 观 


本 章 后 面 将 讨论 连接 计算 机 和 外 部 系统 (例如 打印 机 或 者 是 其 他 计算 机 ) 的 外 部 总 线 。 
首先 介绍 将 高 性 能 外 围 设备 与 计算 机 连接 的 SCSI 总 线 。 


4.8 SCSI 41 SAS 接口 


最 早 设计 用 来 连接 计算 机 和 外 围 设备 的 外 部 总 线 之 一 是 SCSI 总 线 ， 它 已 经 被 证 明 适 应 
于 这 个 变化 的 世界 。 曾 经 有 一 段 时 间 ， 它 是 专业 和 高 端 系统 中 总 线 的 首选 。 今 天 ， 面 对 非 
常 低 成 本 和 高 性 能 的 总 线 ， 例 如 USB 和 火线 ， 它 的 应 用 范围 正在 减 小 。 本 节 讨 论 它 是 因为 
其 在 计算 机 发 展 中 的 作用 和 对 其 他 总 线 设 计 的 影响 。 本 节 还 将 介绍 现代 的 串 行 连接 的 SCSI 
(serial attached SCSI，SAS)， 它 采用 了 低 成 本 的 串 行 技术 。 基 于 SAS 的 产品 最 早 在 2005 年 
被 使 用 。 

小 型 计算 机 系统 接口 (Small Computer System Interface, SCSI) 是 一 种 可 以 追溯 到 1979 
年 的 8 位 并 行 总 线 ， 当 时 磁盘 制造 商 Shugart 试图 为 其 硬盘 系列 产品 寻找 一 种 通用 的 接口 。 
SCSI 总 线 是 一 种 并 行 数 据 总 线 ， 它 整合 了 为 总 线 的 预期 用 途 而 优化 的 信息 交换 协议 ， 实 现 
了 磁盘 驱动 器 和 其 他 存储 系统 与 主机 计算 机 的 连接 。 图 4-61 说 明了 SCSI 总 线 的 概念 ， 它 
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最 初 被 称 为 Shugart 联合 公司 系统 接口 (Shugart Associates System Interface, SASI) HA. 
1981 Æ, Shugart 和 NCR 与 ANSI 合 作 规 范 SCSI 总 线 ， 它 在 1986 年 成 为 X3.131-1986 
标准 。 


| :cs 主机 适配器 SCSI 磁盘 | SCSI 磁盘 | SCSI 磁带 
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图 4-61. SCSI 总 线 


最 初 的 SCSI-1 总 线 工 作 在 5MHz， 人 允许 最 多 7 个 外 围 设备 连接 在 一 起 。 人 们 提出 了 具 
有 相同 体系 结构 和 不 同 级 别 性 能 的 一 系列 SCSI 总 线 (如 表 4-7 所 示 )。1991 年 对 规范 进行 
了 修订 ， 提出 了 快速 (fast) SCSI-2 BA, 它 工作 在 10MHz， 是 具有 16 条 数据 路 径 这 样 宽 
(wide) 的 总 线 。Ultra SCSI 或 SCSI-3 是 下 一 步 ， 它 的 时 钟 频 率 为 20MHz。 所 有 SCSI 系统 
都 支持 异步 数据 传输 ， 但 SCSI-2 还 支持 更 快 的 同步 数据 传输 。USB 3.0 总 线 提供 了 4.8Gb/s 
或 600MB/s 理论 极限 。 


与 8 位 和 16 位 版 本 的 SCSI 总 线 ld 
— pee SCSI 有 3 种 电气 接 oO A SCSI u ca ae — 吞吐 率 = 


线 支持 传统 的 单 端 (single-ended) 电气 a 一 二 
接口 ， 其 中 数据 信号 的 电 平 参照 OV 的 “Faswiaescst | 16 | 10 | 20 
地 线 参考 电 平 进行 传输 。 长 途 传输 将 UltrascsI 用 可 20 
导致 外 部 SCSI 和 磁盘 像 天 线 那样 动作 ， Wide Ultra scsi | 16 | 20 | 40 
接收 外 来 信号 将 导致 错误 和 不 正确 的 “Una2scSL | s| 4 | 40 
操作 。 比 参考 地 线 传输 数据 信号 更 好 WeUmzscsi| 16 | 4 | 80 
的 机 制 是 使 用 差分 信号 (differential —— ee = 
signaling)， 其 中 数据 以 一 对 线 (类 似 SR a6 | 320 a 
PCI express) 间 的 电压 来 传输 。 差 分 信 


号 需要 两 倍 的 连接 数量 ,但 更 加 不 容易 受到 干扰 ， 因 为 干扰 在 一 对 导线 上 增强 了 信号 ,但 这 
并 不 影响 相 邻 导线 之 间 信 和 号 水 平 的 差异 = 这 种 在 两 条 导线 上 表现 出 来 的 抗 干扰 能 力 ， 称 为 共 
模 抑 制 (common-mode rejection)。 差 分 模式 传输 允许 传输 路 径 为 25m， 相 比 之 下 传统 的 单 
端 SCSI 系统 的 最 大 传输 路 径 为 3m。 因 为 SCSI 是 总 线 ， 它 需要 在 总 线 两 端 具有 终止 装置 以 
防止 反射 ( 见 本 章 的 前 面部 分 )。 

另 一 种 电气 接口 是 低压 差分 (low-voltage differential,LVD)SCSI， 它 也 使 用 了 差分 信和 号， 
但 电压 更 低 。 低 压 信 号 技术 提高 了 接收 者 的 性 能 、 降 低 了 能 耗 ， 并 人 允许 接口 与 SCSI 芯片 集 
成 。 二 些 SCSI 系统 使 用 光纤 通道 (fiber channel)， 即 使 用 光纤 的 串 行 接口 。 虽 然 光学 系统 
需要 数据 转换 器 和 并 串 “ 并 行 到 串 行 ) 转换 器 ， 但 它们 对 干扰 高 度 免 疫 。 

给 出 了 SCSI 的 起 源 ,那么 SCSI 总 线 已 在 中 速 至 高 速 专业 系统 中 成 为 受 欢 迎 的 磁盘 接 
口 就 不 足 为 奇 了 。SCSI 磁盘 驱动 器 包括 内 部 SCSI 接口 ， 只 需要 一 个 连接 器 和 将 其 连接 至 
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SCSI BAM FA. 这 些 当 然 对 PC 中 曾经 流行 但 现在 已 经 过 时 了 IDE 接口 也 是 一 样 的 。 尽 
管 高 性 能 快速 wide SCSI PCI KAW MMR, 但 适用 于 PC 的 SCSI 总 线 接口 卡 非 常 普遍 上 且 价 格 
低廉 。 

SCSI 总 线 具 有 它 自己 的 术语 ，SCSI 文献 中 谈 到 发 起 者 (initiator) 和 目标 (target)( 它 们 
也 是 PCI 总 线 适 用 的 术语 )。 发 起 者 是 可 以 选择 SCSI 总线 上 的 目标 并 向 其 发 送 命令 的 一 种 
设备 。 发 起 者 是 主机 处 理 器 〈 即 SCSI 总 线 控制 器 ) 的 接口 ， 目 标 是 使 用 SCSI 总 线 的 外 围 设 
备 ( 如 ， 磁 盘 驱动 器 或 打印 机 )。SCSI 总 线 支持 多 达 8 个 发 起 者 和 目标 。 系 统 可 能 具有 多 个 
发 起 者 ， 但 同时 只 有 一 个 是 活跃 的 ， 大 部 分 系统 只 有 一 个 发 起 者 。 每 台 连 接 到 SCSI ARE 
的 设备 具有 一 个 地 址 或 SCSI ID。SCSI 设备 也 被 分 配 8 个 逻辑 单元 号 (logical unit number, 
LUN) 允许 单个 SCSI 设备 被 划分 成 1 ~ 8 个 逻辑 设备 。 

SCSI 总 线 操 作 使 用 消息 传递 (message-passing) 原理 ， 发 起 者 告诉 目标 它 想 要 执行 什么 
操作 。 实 现 这 种 模式 的 原因 是 由 于 SCSI 作为 处 理 器 与 磁盘 间 总 线 的 角色 。 目 标 需 要 相对 长 
的 时 间 来 响应 来 自发 起 者 的 命令 (例如 ， 





在 磁盘 上 寻找 一 个 给 定 的 磁道 )。 此 外 ， 表 4-8 SCSI-1 总 线 信号 
发 起 者 传输 的 命令 可 能 相当 长 ， 由 10 个 引 肢 功能 
或 者 更 多 的 字 节 组 成 。SCSI 总 线 的 特性 “DBC) 一 DPC) |8 位 数据 总 经 
是 ， 若 当前 目标 正 繁忙 地 执行 所 分 配 的 、 了 2 中 ae 
任务 ， 总 线 可 以 钼 释放 (release)， 从 而 REO 目标 请 求 传输 周期 时 使 用 的 请 求 信号 
被 另 一 个 设备 使 用 。 ACK 发 起 者 完成 数据 传输 时 使 用 的 确认 信号 
1. SCSI 信号 TD 发 出 控制 /数据 消息 来 指示 控制 或 数据 传输 
SCSI-1 总 线 由 18 根 数据 线 、 数 据 “MSG 指出 被 传输 的 信息 是 消息 的 一 个 信号 
流 控 制 线 以 及 如 表 4-8 所 示 的 控制 线 BSY 指出 总 线 不 是 空闲 的 一 个 忙 信 号 
组 成 ， 总 线 操作 类 似 一 个 状态 机 (state SEL 在 总 线 选择 操作 中 发 出 的 一 个 信号 
machine) 任何 时 刻 总 线 处 于 几 个 固 AN 由 发 起 者 在 希望 访问 目标 时 发 出 的 注意 信号 
定数 量 的 状态 之 一 6 eTA EST 将 总 线 清空 、 重 置 所 有 发 起 者 的 复位 信号 
简化 的 SCSI 总 线 的 状态 图 ， 表 4-9 描述 了 这 些 状态 


复位 
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图 4-62 SCSI 总线 的 状态 转换 图 


E RZA (bus free) KA, BAS, 没有 设备 要 使 用 它 。 这 个 阶段 通过 作废 SEL 和 
BSY 信号 来 指示 。 在 仲裁 (arbitration) 阶段 ， 二 个 或 多 个 设备 试图 控制 总 线 记 在 选择 或 重新 
选择 (selection or reselection) 阶段 ; 发 起 者 使 目标 执行 给 定 的 任务 。 在 信息 传递 (information 
transfer) 阶段 ， 数 据 在 目标 和 发 起 者 之 间 交 换 。 
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R 4-9 SCSI 总 线 状态 

状态 描述 
总 线 空闲 | ”总 线 空闲 状态 ， 没 有 设备 正在 控制 总 线 或 者 传输 数据 该 状态 由 作废 SEL 和 BSY 信号 线 来 指示 
仲裁 当 设 备 希 望 控制 总 线 并 成 为 发 起 者 ， 它 通过 发 出 BSY 信号 并 将 其 ID 放 在 数据 总 线 上 进入 仲裁 状态 。 
如 果 没 有 更 高 优先 级 的 设备 需要 使 用 总 线 ， 它 将 继续 并 通过 发 出 SEL 信号 声明 控制 总 线 

在 选择 状态 ， 发 起 者 选择 ( 即 指定 ) 一 个 目标 设备 并 发 出 命令 使 其 执行 特定 的 操作 。 通 过 将 目标 设备 
和 发 起 者 的 逻辑 或 (OR) 放 到 总 线 上 来 完成 选择 
重新 选择 | “因为 目标 在 长 时 间 操作 时 能 够 放弃 总 线 ， 在 目标 重新 声明 需要 使 用 总 线 时 需要 重新 选择 状态 
命令 目标 设备 使 用 命令 阶段 请 求 发 起 者 的 命令 。 目 标 将 C/D 信号 置 为 低 来 指示 一 条 命令 ; 将 C/D 信号 置 


选择 


为 高 来 指示 输出 操作 
数据 在 数据 阶段 ， 数 据 在 发 起 者 和 目标 之 间 传 输 
消息 接口 由 发 起 者 和 目标 之 间 发 送 的 消息 控制 
状态 目标 向 发 起 者 返回 一 个 代码 ， 表 明 操作 的 状态 
2.SCSI 总 线 事务 


下 面 介绍 典型 的 SCSI 总 线 事务 。 假 设 主 机 处 理 器 希望 从 硬盘 读 取 一 个 文件 。 处 理 器 首 
先 访问 SCSI 发 起 者 ,这 当然 是 CPU 和 SCSI 总 线 之 间 的 接口 。 发 起 者 几乎 就 是 单个 集成 电 
路 ， 对 主机 来 说 就 是 一 个 存储 器 映射 的 外 围 设备 。 

发 起 者 检查 BSY 信号 确定 总 线 目前 是 否 空闲 。 如 果 它 是 空闲 的 ,发 起 者 开始 仲裁 使 用 
总 线 SCS] BAM 8 条 数据 信号 线 中 的 每 一 条 都 与 8 个 仲裁 级 别 ( 每 个 可 能 的 :SSCSE 总 线 用 
户 对 应 一 个 ) 之 一 相关 联 。SCSI 总 线 支 持 了 个 外 围 设备 一 一 SGCSI 总 线 发 起 者 具有 其 自己 的 
地 址 成 为 第 八 个 设备 。 

请 求 设备 所 要 做 的 就 是 在 安装 过 程 中 向 分 配给 它 的 数据 线 发 出 信号 a 被 选中 的 数据 线 通 
过 集 电极 开路 输出 为 低 电 平 有 效 ， 与 .NuBus 仲裁 的 情况 完全 一 样 。 如 果 参 与 仲裁 过 程 的 设 
备 发 现 二 个 或 多 个 高 级 别 数据 线 被 其 他 设备 驱动 为 低 ， 它 将 离开 仲裁 过 程 和 并 服从 更 高 优先 
级 的 设备 。 

一 旦 发 起 者 获得 总 线 的 控制 权 ， 它 进入 选择 (selection) 状态 ;允许 其 寻 址 或 选择 另 一 
个 总 线 上 的 设备 。 发 起 者 发 出 选择 信号 5EL， 以 及 要 选择 设备 身份 相对 应 的 数据 位 和 与 自己 
身份 相对 应 的 数据 位 。 例 如 ;发 起 者 的 设备 编号 为 7， 希 望 选择 的 设备 编号 为 3， 发 起 者 发 
出 SEL 信号 并 设置 DB(7) 和 DB(3) 为 低 。 发 起 者 现在 可 以 释放 BSY 信号 线 。 

被 选中 的 设备 ( 即 目标 ) 检测 到 它 将 被 访问 ， 并 自己 发 出 BSY 信号 来 控制 总 线 。 发 起 者 
然后 释放 它 使 用 的 两 条 数据 线 ， 并 作废 SEL 信号 。 注 意 ， 选择 和 重新 选择 (reselection) W 
段 是 相似 的 。 当 目标 原来 被 选择 ， 目 标的 操作 完成 前 被 总 线 空闲 阶段 终止 操作 时 ， 才 会 发 生 
重新 选择 。 一 旦 设备 被 选择 或 重新 选择 ， BREE. Ben ee Tet 
操作 之 一 : 命令 、 消 息 输出 "消息 输入 状态 、 数 据 输出 和 数据 输入 。 

通过 使 用 REQ 和 ACK 握手 信号 来 控制 数据 流 ， 现 在 可 以 在 发 起 者 和 目标 之 间 通 过 总 线 
进行 数据 传输 。REQ 请 求 数 据 传输 ，ACK 对 其 进行 确认 ， 就 像 前 文 描述 的 具有 两 根 信号 线 
的 异步 数据 传输 协议 。 这 两 个 控制 信号 IO 和 CD 确定 数据 流向 和 DB(0) ~ DB(7) 上 的 信 
息 是 数据 还 是 命令 。 起 初 ， 目 标 发 出 C/D 信号 请 求 来 自发 起 者 的 命令 ,发 出 REQ 信和 号 来 触 
发 数据 传输 (在 这 个 阶段 ， 目 标 知 道 其 已 经 被 寻 址 ,但 并 不 知道 为 什么 )。 发 起 者 将 一 个 字 
节 放 到 数据 总 线 上 然后 发 出 ACK 信号 ， 它 是 REQ 的 握手 信和 号。 然后 根据 对 第 一 个 命令 字 
节 的 解释 ， 目 标 可 能 会 请 求 更 多 的 命令 字 节 。 
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当 向 目标 发 出 长 的 命令 时 ， 发 起 者 可 以 为 其 他 SALANN 总 线 ， 稍 后 再 执行 重新 选择 
阶段 。 这 使 得 SCSI 总 线 在 目标 忙 着 执行 其 任务 时 变 为 空 

SCSI 总 线 已 经 被 证 明 是 非常 受 欢迎 的 ， 因 为 en Teel, 并 在 USB、 火 线 以 及 
WiFi 被 广泛 使 用 之 前 能 够 很 好 地 适应 中 速 、 高 速 外 围 设备 ， 如 硬盘 驱动 器 、 光 盘 (CD) 5K 
动 器 、 打 印 机 和 光学 扫描 仪 。 

3. SCSI 消息 和 命令 

SCSI 总 线 的 发 起 者 和 目标 之 间 的 消息 长 度 差 异 为 1 个 字 节 、3 个 字 节 或 者 更 多 的 字 节 。 
一 个 典型 的 由 目标 发 送 给 发 起 者 的 消息 是 命令 完成 (command complete)， 表 明 命令 已 经 完 
成 ， 且 一 个 状态 字 节 已 经 返回 给 发 起 者 。 同 样 ， 来 自 目标 的 断路 (disconnect) 消息 告诉 发 起 
者 ; 连接 将 被 挂 起 ， 稍 后 再 连接 。 

SCSI 总线 也 支持 作用 于 设备 本 身 ( 如 磁盘 驱动 器 和 打印 机 ) 的 命令 。 命 令 从 发 起 者 以 顺 
序 字 节 帧 的 形式 传递 。 典 型 的 SCSI 命令 格 式 包 含 以 下 信息 。 

操作 码 一 一 定义 操作 的 命令 ， 一 个 字 节 。 操 作 码 还 包括 3 位 组 代码 用 来 表示 命令 的 
类 型 。 

逻辑 单元 编号 (LUN) 一 一 用 来 标识 附加 到 目标 上 的 设备 ， 一 个 字 节 。 该 特性 允许 多 个 
功能 单元 连接 到 一 个 目标 。 

逻辑 块 地 址 一 一 可 选 值 ，2 个 或 4 个 字 节 ， 为 数据 传输 提供 起 始 地 址 。 

传输 长 度 一 一 可 选 参数 ， 一 个 字 节 ， 定 义 了 在 读 或 写 操作 中 被 传输 的 逻辑 块 的 数量 。 

参数 表 长 度 一 一 用 来 配置 操作 LUN 的 参数 表 的 长 度 。 





控制 一 一 一 个 字 节 ， 用 来 决定 SCSI 总 线 将 如 何 表现 。 例 如 ， 它 可 以 用 来 表明 总 线 在 当 
前 命令 后 不 应 被 释放 ， 因 为 发 起 者 将 会 发 出 男 一 个 命令 

SCSI 总 线 规范 中 实际 的 命令 与 磁盘 驱动 器 、 打印 机 、 CD-ROM 和 其 他 外 围 设备 的 操作 
有 关 。 然 而 ， 它 提供 了 作用 于 所 有 外 围 设备 的 一 些 通用 命令 。 例 如 ， 查 询 ( inquiry) 命令 要 
求 目 标 提 供 自己 的 以 及 相关 外 围 设备 的 参数 。 

SCSI 总 线 非常 有 趣 ， 因 为 它 模 糊 了 总 线 与 其 接口 以 及 连接 至 总 线 上 的 设备 之 间 的 区 别 。 
此 外 ， 它 还 包括 一 个 专门 为 希望 使 用 该 eee TE 
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| AHR MAEM MOAR i BRB EMA 慢 Ce oe o ae a 
# 473422 SCSI (SAS) 试图 保留 SCSI 的 最 好 部 分 同时 向 | USB 和 ae Pina 
| RAMs PITE SCSI 54% SCS 陈旧 的 物理 层 ， 将 其 蔡 换 为 低 成 本 、 高 性 能 的 囊 行 
;接口 6. 这 种 囊 行 接口 提供 比 硬 盘 最 大 读 / 写 速 认 快 得 多 的 12Gb/s 的 吞吐 量 。 在 2004 年 
ah Bb, SAS 支持 3Gb/s， 至 2007 年 增加 到 6Gb/s, naani Aa wen AS . imap 
nae SSCS HFRERBEAS 04 ER ee 
SAS 的 物理 层 使 用 差 动 信号 ， So #R) He, hte 9081 ee : 
.所 需 放 大 的 终止 网络 不 再 是 必需 的 。， SAS 定义 了 两 个 低级 层 一 一 物理 层 和 PHY 层 ; 把 
传统 物理 层 的 功能 (加 上 一 些 传统 的 链 路 层 功 能 ) PARE. 物理 层 只 关心 连接 器 和 电 
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压 水 平 ， PHY BASHIR MEIRIN, RRMA VAL AMA. SAS 使 用 8b/10b 
编码 5 Loa 
sie eae ee, o as gar Be, SATA ROE 
已 经 被 所 有 现代 硬盘 驱动 器 使 用 。 因 此 ， 在 传统 的 PC 和 基于 SAS 的 系统 上 可 以 使 用 相 
同 的 低 成 本 连接 器 。 此 外 ，SAS 支持 SATA 隧道 协议 (STP), 使 传统 的 硬盘 驱动 器 可 以 
连接 到 SAS 体系 结构 中 。 ~-- -一 一 
每 个 SAS 设备 在 制造 时 都 被 分 配 了 一 个 唯一 的 地 址 ; 也 就 是 说 ， 每 个 设备 在 被 购买 
时 都 有 其 自己 的 地 址 。 地 址 由 名 字 地 址 权威 ( NAA，Name Address Authority) 国际 组 织 
分 配 ， 它 也 负责 海外 SAS 地 址 分 配 。 
SAS 是 技术 融合 ( 串 行 传输 和 SCSI 网 络 ) 的 一 个 很 好 的 例子 ， 也 是 计算 机 工业 如 何 
RMA (Jo, H47 SCS 固有 的 过 度 缓慢 问题 ) 的 一 个 很 好 的 例子 。 





4:9， 串 行 接口 总 线 


曾几何时 ， 串 行 总 线 用 速度 来 换取 简单 性 并 行 总 线 需 要 多 个 数据 路 径 和 相应 复杂 的 接 
插件 安排 及 导线 ， 而 品行 总 线 使 用 两 条 信号 线 来 每 次 传输 一 位 数据 (bit at a time): 一 条 信 
号 线 传输 数据 ， 一 条 用 于 电 回 路 。 使 用 光纤 电缆 的 串 行 数据 链 路 需要 提供 单个 数据 路 径 。20 
世纪 70 年 代 的 RS232C 串 行 连接 速度 缓慢 ， 用 户 如 果 需 要 提高 速度 就 必须 使 用 并 行 数 据 总 
线 。 早 期 的 PC 具有 使 用 DB225 连接 器 由:8 条 数据 线 组 成 的 并 行 端口 ， 用 户 可 以 使 用 25 
路 带 状 电缆 将 其 与 打印 机 连接 。 现 在 某 些 打印 机 仍然 还 具有 这 样 的 一 些 基 本 并 行 接口 ， 尽 管 
它们 越 来 越 显 得 过 时 了 。 现 代 串 行 数据 链接 简单 、 快 速 、 并 且 有 效 。 

串 行 数据 总 线 最 大 的 优势 是 它 的 易 用 性 。 下 面 将 介绍 的 总 线 2 对 计算 产生 了 巨大 的 影 
响 ， 因 为 它们 为 计算 机 与 外 部 设备 甚至 是 其 他 计算 机 之 间 的 连接 提供 了 低 成 本 、 高 性 能 的 解 
决 方案 :下面 首 先 开始 介绍 对 计算 机 通信 产生 深远 影响 的 串 行 总 线 : 以 太 网 s 


RS232C E3 : 
。 可 能 今天 大 多 数 计 算 机 用 户 都 不 知道 RS232C 是 什么 ， 或 者 说 曾经 是 什么 。1969 年 ， 
电子 工业 协会 (Electronic Industries Association) 创建 了 两 个 不 同 设备 间 的 接口 标准 :。 
数据 终端 设备 (data terminal equipment, DTE) 和 数据 通信 设备 (data communications 
equipment，DCE)。 这 两 个 标准 适用 于 调制 解 调 器 ， 它 通过 电话 线 以 约 9600bit/s Hi 
度 在 计算 机 间 传 输 数 据 。 RS232C TREK GIR ALARE- ERNE Cte TB 
Pilo 4 
RS232C 接口 使 用 A 行 传输 数 : 没有 使 用 a ISEH EN 字符 对 应 传输 
8 一 11 个 脉冲 用 来 代表 ASCH 编码 字符 )， 一 次 只 传输 一 位 实现 串 行 传输 数据 。 数 据 连 
接 器 为 DB-25， 具 有 25 针 的 插头 和 插座 (使 用 25 根 导线 在 两 个 数据 通道 传输 数据 ， 每 
“个 方向 上 的 速率 为 ere 除了 ep gt ee olan sarupa 
指示 器 (ring indicator). OOS ica es 














日 实际 上 ， 在 讨论 并 行 背 板 总 线 时 已 经 介绍 了 品行 总 线 PCI Express， 因 为 它 在 物理 串 行 数据 路 径 上 建立 了 虚拟 
并 行 总 线 。 
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第 一 代 微 处 理 器 系统 使 用 现 有 的 了 RS232C 标准 将 计算 机 与 其 他 设备 (例如 打印 机 ) 
连接 在 一 起 。 这 种 情况 成 为 一 个 重 梦 ， 因 为 RS232C 的 设计 并 没有 预先 的 规划 ， 导 致 的 
结果 是 接口 通常 需要 手动 设置 计算 机 中 的 开关 ， 甚 至 不 得 不 在 引 脚 间 焊 接 导 线 。 那 时 ， 
即 插 即 用 (plug and play) 的 概念 还 没 出 现 ， 用 户 不 得 不 为 每 个 连接 到 串 行 链 路 上 的 设备 
获取 驱动 ， 通常， 简单 地 使 打印 机 工作 就 能 成 为 一 项 真正 的 成 就 。 今 天 ， 用 户 只 要 把 打 
印 机 和 计算 机 通过 USB 电缆 连接 在 一 起 ， 一 切 就 搞定 了。 ” ， 
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本 节 通 过 简单 描述 以 太 网 ( Ethernet) 来 介绍 串 行 总 线 ， 以 太 网 是 用 来 支持 10Mb/s 的 局 
域 网 的 。 以 太 网 可 以 追溯 到 1978 年 ， 现 在 已 经 成 为 IEEE 802.3 标准 。 今 天 ， 它 是 低 成 本 、 
工作 在 100Mb/s 或 1Gb/s 的 局 域 网 标准 。 

在 以 太 网 中 ， 所 有 设备 都 被 连接 到 一 根 电缆 上 ， 不 需要 特殊 的 控制 线 。 设 备 或 节点 ， 可 
以 传输 串 行 数据 至 连接 了 所 有 其 他 设备 的 公共 总 线 。 以 太 网 传输 电缆 现在 有 和 个 可 用 版 本 : 
厚 同 轴 电 缆 、 细 同 轴 电 缆 、 低 成 本 无 屏蔽 的 双 绞 线 以 及 光纤 。 表 4-10 定义 了 这 些 连 接 的 命 
名 法 。10 指 的 是 链 路 的 速度 ,，Base 指 的 是 基带 (baseband) 传输 (与 调制 (modulated) 载波 
系统 相对 应 ) 5/2/T/F 指 的 是 介质 类 型 。 术 语 1000BaseF 指 的 事 以 太 网 介质 使 用 光纤 、 王 作 
在 1Gb/s。 

表 4-10” 以 太 网 物理 介质 的 命名 约定 





最 大 节点 / 段 
















10Bases 
10Base2 
10BaseT We ITT INR os oy AO pe sae 
10BaseF 光纤 


数据 以 包 (packet) BK (frame) 的 形式 传输 ， 如 图 4-63 所 示 。 一 个 以 太 数据 包 由 7 个 
字段 组 成 ， 开 始 为 8 个 字 节 (64 位 ) 的 报头 (preamble)， 用 来 使 接收 者 的 时 钟 与 传输 比特 流 
同步 。 前 7 个 字 节 的 位 模式 为 10101010。 报 头 的 最 后 一 个 字 节 为 帧 首 定 界 符 ( start of frame 
delimiter)， 其 特定 模式 10101011 表明 一 个 帧 的 开始 。 





8 字 节 6 字 节 6 字 节 .2 字 节 46 ~ 1500 字 节 457 
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图 4-63 以 太 帧 


48 位 目的 和 源 地 址 字段 指出 包 从 哪里 来 ， 到 哪里 去 。 长 度 字段 定义 了 数据 包 的 大 小 ， 
长 度 为 46 ~ 1500 Fo 然而 := 由 于 最 小 的 数据 字段 必须 包含 至 少 46 字 节 ， 比 46 字 节 少 的 
数据 字段 需要 被 填充 为 46 字 节 。 最 后 ，32 位 的 帧 校 验 序列 提供 了 强大 的 错误 检测 码 。 

与 并 行 总 线 不 同 ， 以 太 网 只 是 一 种 消息 交换 机 制 ( 即 没 有 控制 信号 )。 以 太 网 上 的 一 个 
节点 简单 地 将 发 给 其 他 节点 的 帧 放 到 以 太 网 上 。 报 文中 的 数据 字段 是 如 何 解释 的 不 属于 以 太 
网 规范 。 以 太 网 物理 层 使 用 的 基带 电缆 ， 使 用 相位 编码 传输 数据 ， 速 率 为 100Mb/s 或 1Gb/s。 
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基带 这 个 词 意味 着 直接 传输 数字 数据 而 不 需要 调制 解 调 器 。 

没有 两 个 节点 可 以 同时 访问 以 太 网 并 且 它 们 的 消息 不 会 相互 产生 破坏 性 的 干扰 。 当 两 条 
消息 重要 时 ， 发 生 了 碰撞 (collision), 两 条 消息 都 会 丢失 。 任 意 一 个 希望 与 另 一 个 节点 通信 
的 节点 只 是 简单 地 传输 其 消息 。 如 果 另 一 个 节点 也 同时 传输 数据 , 或 是 在 该 消息 完成 传输 之 
前 发 出 ， 消 息 都 会 丢失 。 消 息 的 丢失 通过 同样 原始 的 技术 发 现 : 如 果 发 送 方 没 有 在 规定 的 超 
时 时 间 内 收 到 确认 信号 ， 它 就 认为 消息 在 传输 过 程 中 被 损坏 。 

当 节 点 可 以 进行 传输 时 没有 任何 的 控制 ， 因 此 没有 什么 可 以 阻止 两 个 或 两 个 以 上 的 节点 
同时 开始 传输 。 最 简单 的 竞争 控制 就 是 让 发 送 者 重新 发 送 消息 。 但 是 这 个 方案 行 不 通 ， 因 为 
竞争 节点 将 重新 发 送 消息 ， 使 得 问题 仍然 得 不 到 解决 。 

检测 到 碰撞 的 更 好 策略 是 回避 (ack off) 或 在 重新 传输 帧 之 前 随机 等 待 二 段 时 间 。 此 
Ja, 竞争 节 点 不 太 可 能 在 完全 相同 的 时 间 重 新 开始 传输 s 以 此 种 竞争 控制 王 作 的 网 络 能 够 很 
好 地 适应 突 发 流量 。 也 就 是 说 ， 只 要 平均 流量 很 低 ( 远 低 于 总 线 的 最 大 容量 )， 这 种 安排 就 
AUTE: 如 果 流 量 上 升 ， 会 出 现 这 种 情况 : 碰撞 导致 重复 发 出 消息 ,会 进一步 产生 碰撞 并 
进一步 出 现 重 复发 出 消息 ， 最 终 导 致 系统 崩溃 。 

以 太 网 的 竞争 控制 机 制 允许 节点 在 其 试图 发 送 帧 之 前 侦 听 总 线 。 如 果 有 节点 已 经 发 出 了 
消息 ， 其 他 节点 就 不 会 试图 发 送 。 在 以 太 网 术语 中 ， 这 就 是 所 谓 的 顺从 (deference)。 只 有 
当 两 个 节点 试图 在 几乎 相同 的 时 刻 进行 传输 时 才 会 发 生 碰撞 s。 一 旦 节点 开始 传输 ， 其 信号 传 
播 至 整个 网 络 ， 其 他 节点 不 可 以 中 断 其 传输 。 对 几乎 所 有 的 系统 ， 该 危险 地 带 ( 即 消息 从 网 
络 的 一 端 传输 到 另 一 端的 时 间 ) 非常 小 。 

对 该 策略 的 进一步 修改 是 让 发 送 方 在 其 传输 时 侦 听 总 线 。 假 设 一 个 发 送 方 开始 传播 ， 与 
此 同时 ， 另 一 个 发 送 方 也 要 开始 传输 。 在 很 短 的 时 间 之 后 ， 两 个 发 送 方 意识 到 总 线 正 被 使 用 
并 中 止 传输 其 消息 。 通 过 这 种 方式 ,发送 方 一 旦 检测 到 碰撞 就 停止 传输 ， 因 此 碰撞 的 影响 被 
减少 。 一 旦 开始 传输 ， 它 获得 通道 ,经 过 网 络 端 到 端 往 返 传 播 时 间 的 延迟 后 ， 就 可 以 确保 一 
次 没有 碰撞 的 成 功 的 传播 。 

以 太 网 所 采用 的 竞争 机 制 被 称 为 基于 碰撞 检测 的 载波 侦 听 多 路 访问 〈carrier sense 
multiple access with collision detect, CSMA/CD) 机 制 。 当 节点 意识 到 其 报 文 被 另 一 个 报 文 
损坏 ， 它 通过 传输 拥塞 (jam) 报 文 来 增强 碰撞 。 如 果 它 立即 停止 传输 ， 其 他 发 送 方 可 能 就 
不 会 检测 到 碰撞 。 磁 撞 可 以 由 作为 组 成 传输 帧 的 一 部 分 的 错误 检测 码 在 很 入 以 后 间接 检测 
到 。 这 个 过 程 效 率 低下 且 浪 费时 间 。 发 送 一 个 短 的 拥塞 报 文 会 使 所 有 的 侦 听 者 发 现 碰撞 。 当 
发 出 拥塞 报 文 后 ， 在 随机 延迟 后 会 试图 进行 下 一 次 传输 。 如 果 多 次 尝试 都 失败 了 ， 随 机 延迟 
的 时 间 会 增加 ， 发 送 方 试图 适应 繁忙 的 通道 。46 字 节 的 最 小 数据 包 大 小 取决 于 检测 碰撞 的 
需要 。 

不 像 其 他 的 通信 系统 ， 以 太 网 依赖 于 消息 的 统计 特性 。 有 这 种 可 能 性 ， 但 不 太 可 能 ， 以 
太 网 节点 由 于 总 是 被 打 断 而 从 来 没有 发 出 一 条 消息 。 

以 太 网 仍然 通过 调制 解 调 器 电缆 连接 电脑 和 局 域 网 中 的 其 他 计算 机 。 今 天 ， 打 印 机 和 存 
储 器 ( 称 为 网 络 附加 存储 器 ) 可 以 连接 到 基于 以 太 网 的 网 络 。 近 年 来 ，WiFi 已 经 取代 了 家 庭 
中 基于 以 太 网 的 网 络 ， 因 为 无 线 网 络 不 需要 有 碍 观瞻 的 电缆 。 然 而 以 太 网 仍然 继续 发 展 ， 现 
在 大 多 数 PC 都 支持 千 兆 以 太 网 。10Gb/s 的 以 太 网 标准 于 2002 年 发 布 ， 它 支持 铜 线 连接 和 
光纤 连接 。2010 年 ，IEEE 发 布 了 40Gb/s 和 100Gb/s 版 本 的 以 太 网 标准 。 

两 种 串 行 总 线 与 个 人 计算 机 密切 相关 : USB 总 线 和 火线 (FireWire) 总 线 。 两 种 总 线 
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执行 类 似 的 功能 。USB 最 初 被 设计 为 低 成 本 、 低 速 的 总 线 ; 用 来 将 诸如 扫描 仪 和 打印 机 之 
类 的 外 围 设备 与 计算 机 相连 。 而 火线 总 线 旨 在 支持 更 快 的 外 围 设备 ， 如 外 部 磁盘 、 摄 像 机 。 
2000 年 ， 更 快 的 USB 2.0 总 线 模 糊 了 两 者 的 区 别 。2010 年 ， 出 现 了 具有 USB 3.0 接口 的 系 
统 ， 可 以 以 4800Mb/s 的 速率 工作 。 下 面 介绍 火线 总 线 。 


4.9.2 FireWire 1394 串 行 总 线 


火线 总 线 (现在 称 为 IEEE 1394 总 线 ) 是 一 个 总 线 的 实例 ， 它 开始 作为 公司 的 一 个 项 目 ， 
后 来 成 为 一 种 行业 标准 。1986 年 Apple 公司 开发 了 火线 ， 作 为 并 行 SCSI 总 线 的 替代 品 ， 用 
于 专业 音频 和 视频 。 火 线 (FireWare) 是 Apple 的 商标 Sony 将 相同 的 总 线 称 为 iLink。 
几 个 因素 对 火线 总 线 的 设计 施 以 影响 。 第 一 个 因素 是 成 本 (cost)。 在 过 去 的 40 年 ， 微 
型 计算 机 被 庶 和 到 几乎 所 有 的 产品 中 ， 从 电视 机 到 洗衣 机 ， 在 视听 领域 尤其 如 此 。 如 果 这 些 
设备 需要 被 连接 ;任意 一 种 链接 方式 必须 相对 便宜 一 一 消费 者 不 希望 为 一 个 插件 支付 一 大 笔 
钱 。 第 二 个 因素 是 体积 大 小 〈size)。 电 子 设备 变 得 越 来 越 小 。 当 计算 机 比较 大 ， 其 后 部 的 连 
接 器 占用 的 空间 并 不 重要 。 小 型 设备 需要 相应 较 小 的 连接 器 (例如 ， 手持 摄像 机 、 电 脑 游戏 
控制 端 、MP3 播放 器 或 者 手机 )。 第 三 个 因素 是 速度 (speed)。 每 年 ,计算 机 的 时 钟 频率 和 
数字 设备 间 的 数据 传输 速度 不 断 增加 1975 年 ，600 波 特 率 。 的 调制 解 调 器 被 认为 是 快 的 ; 
到 了 1995 年 ，28.8Kb/s 的 调制 解 调 器 通常 用 来 作为 计算 机 与 Internet 的 接 日 ; 到 了 2000 年 ， 
在 许多 家 庭 中 可 以 发 现 512Kb/s 的 电缆 调制 解 调 器 。 今 天 许多 计算 机 用 户 的 电缆 调制 解 调 器 
以 20Mb/s 或 更 快 的 速度 工作 。 第 四 个 因素 是 可 靠 性 (reliability)。 系 统 通常 由 于 连接 器 的 故 
障 而 失效 ， 这 在 很 大 程度 上 是 因为 重复 插 拔 插头 或 不 断 扭曲 电缆 而 造成 的 。 可 靠 的 连接 器 应 
该 具有 尽 可 能 少 的 信号 通路 。 
20 世纪 90 年 代 早期 ， 最 初 称 为 P1394 的 高 性 能 串 行 总 线 被 提出 CP” 表示 临时 标准 )。 
HEF SCSI 总 线 这 样 的 并 行 总 线 ， 串 行 总 线 具 有 许多 优点 。 特 别 是 ， 串 行 总 线 只 有 两 个 连 
接 器 (如果 使 用 光纤 ， 只 需要 使 用 一 个 )， 这 样 降低 了 连 线 的 成 本 以 及 连接 器 的 成 本 和 大 小 。 
P1394 总 线 利 用 现 有 的 最 佳 技 术 来 设计 ， 可 以 支持 多 个 不 同 的 物理 层 physical layers); 也 
就 是 说 ，P1394 总 线 并 没有 与 某 种 类 型 的 物理 层 实现 绑 定 。 串 行 总 线 的 一 些 最 重要 的 特征 
如 下 。 
e 节点 〈 即 连接 到 总 线 的 设备 ) 地 址 的 自动 赋值 ， 不 需要 地 址 开关 或 其 他 方式 为 节点 分 
配 地 址 。 

e 变速 数据 传输 ， 从 TTL 背 板 电缆 的 24Mb/s 至 有 线 介质 的 400Mb/s. IEEE 1394b 规 
范 将 每 个 报 文 包含 比特 位 的 数量 翻 了 一 番 ， 使 得 总 线 速度 增加 为 800Mb/s。 

© 有 线 介质 允许 最 多 16 个 物理 连接 或 有 线 跃 程 (cable hop)， 每 个 路 程 最 大 为 4.5m。 

e 公平 的 总 线 访问 机 制 保 证 所 有 节点 同等 的 访问 权 。 





日 、 当 然 ， 对 该 说 法 需要 补充 说 明 ; 处 理 器 的 最 大 时 钟 频率 在 约 2010 年 后 停止 快速 增长 。 然 而 ， 由 于 微 体 系 结 
构 的 改进 去 专门 的 指令 集 和 多 核 处 理 器 的 使 用 ; :使 得 处 理 器 的 性 能 持续 提高 。 

S 数据 传输 速率 通常 以 每 秒 传输 的 位 (比特 ) 数 来 表示 。 波 特 率 这 个 术语 来 自 电 报 ， 并 通过 开关 或 信号 的 传输 
速率 ( 即 ， 每 秒 传输 的 码 元 数 ) 来 衡量 。 如 果 数 据 使 用 两 级 的 二 进 制 信号 传输 ， 数 据 传输 速率 和 波 特 率 是 相 
同 的 。 然 而 ， 如 果 使 用 八 级 信号 进行 传输 ， 由 于 每 个 码 元 可 以 携带 3 位 数据 ， 数 据 传输 速率 将 为 波 特 率 的 
3 售 。 
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o 符合 IEEE Std 1212-1991, (ANSI) 微机 总 线 的 IEEE 标准 控制 和 状态 寄存 器 (Control 

and Status Register, CSR) 体系 结构 。 

e 1394 串 行 总 线 限 制 总 线 上 的 节点 数量 为 63。 然 而 ， 通 过 总 线 桥 接 多 个 总 线 的 方法 可 

以 支持 多 达 2 个 节点 。 

1394 串 行 总 线 规范 从 开放 系统 互 连 (open systems interconnection ,OSI) 借用 ISO 模型 。 
特别 是 ， 串 行 总 线 标准 使 用 了 抽象 层 ， 每 个 抽象 层 完 成 特定 的 任务 。1394 接口 的 三 层 接口 
本 质 上 与 PCI express 总 线 是 相同 的 。 

物理 层 一 一 该 级 定义 了 信息 在 总 线 上 的 传输 方式 。 它 关心 的 是 介质 的 电气 性 能 和 信号 传 
输 技术 。 物 理 层 链 路 采用 其 上 层 链 路 层 的 逻辑 符号 (logical symbol)， 通 过 接口 传输 这 些 符 
号 ， 并 将 它们 传输 给 另 一 个 节点 的 链 路 层 。 

链 路 层 一 一 该 级 描述 数据 包 在 总 线 上 的 传输 方式 。 链 路 层 从 物理 层 获取 数据 ， 完 成 数据 
帧 处 理 、 寻 址 和 错误 检测 。 链 路 层 将 数据 传递 给 上 层 事务 层 。 在 串 行 总 线 术 语 中 ， 完 整 的 链 
路 层 操作 包括 : 仲裁 、 包 传输 以 及 被 称 为 子 处 理 (subaction) 的 确认 。 

事务 层 一 一 该 级 关心 总 线 上 互相 通信 的 节点 使 用 的 端 对 端 协议 。 一 个 节点 的 事务 层 从 应 
用 程序 接收 数据 并 将 其 传递 到 链 路 层 。 在 另 一 个 节点 ， 对 应 的 事务 层 从 链 路 层 获 取 数 据 并 将 
其 传递 给 应 用 程序 。 

图 4-64 描述 了 1394 串 行 总 线 的 分 层 协议 。 每 层 都 提供 了 特定 的 服务 。 因 为 每 层 都 与 其 
上 层 和 下 层 按照 严格 指定 的 方式 通信 ， 可 以 将 任何 意 一 层 蔡 换 为 执行 相同 功能 的 系统 。 也 
就 是 说 ，1394 串 行 总 线 是 技术 独立 的 (technology independent)。- 例 如 ， 开 发 一 种 更 快 的 串 
行路 径 ， 可 以 用 新 技术 来 实现 物理 层 ， 而 使 用 物理 层 提供 服务 的 链接 层 和 事务 层 不 会 受到 
影响 。 
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图 4-64 ”火线 分 层 协议 


1394 串 行 总 线 的 总 体 结构 如 图 4-65 所 示 。1394 标准 定义 了 两 个 串 行 总 线 环 境 。 一 个 
是 在 处 理 器 系统 内 的 背 板 环境 (backplane environment)， 另 一 个 是 连接 外 部 系统 的 电缆 环境 
(cable environment)。 背 板 环境 具有 总 线 拓 扑 结构 ， 工 作 速 度 为 25.576Mb/s 或 49.152Mb/s 
(取决 于 技术 )。 电 缆 环境 支持 98 ~ 400Mb/s (1394a) 或 者 800Mb/s ( 1394b) 的 速率 。 这 两 
个 环境 支持 不 同 的 物理 层级 拓扑 结构 、 仲 裁 机 制 以 及 传输 速率 。2007 年 发 布 的 火线 S1600 
和 S3200 版 分 别 支持 1.6Gb/s 和 3.2Gb/s 的 速率 。 

如 图 4-65 所 示 ， 串 行 总 线 上 的 单个 节点 可 能 位 于 不 同 的 背 板 环境 中 。 从 图 4-65 RRE 
易 看 出 串 行 总 线 实际 上 是 树 形 (tree) 拓扑 结构 。 图 4-66 显示 了 一 个 简单 具有 5 个 节点 的 树 
形 结构 。 每 个 节点 要 么 是 分 支 (branch) 直接 连 着 多 个 邻居 ， 要 么 者 是 叶子 (leaf) 只 有 一 个 
邻居 。 许 多 串 行 总 线 应 用 菊 链 (daisy-chain) 将 节点 以 特殊 的 树 形 结构 连接 在 一 起 。 
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图 4-65 “火线 系统 的 结构 


@ Cengage Learning 2014 
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1. RRS 

支持 多 个 节点 的 系统 必须 区 分 各 个 节点 。 1394 串 行 总 线 提供 了 64 位 寻 址 ， 每 个 地 址 的 
高 16 位 代表 节点 的 ID (身份 ) 支持 64K 个 节点 。 串 行 总 线 将 该 ID 划分 为 两 个 子 字段 : 高 
10 位 指出 总 线 D， 低 6 位 指定 物理 ID 使 每 个 电缆 可 支持 64 个 设备 。 地 址 的 其 余 48 位 分 
为 寄存 器 空间 、ROM ID 空间 、 初始 单元 空 间 以 及 初始 存储 器 空间 。 这 48 位 与 具体 实现 有 
关 ; 也 就 是 说 ， 它 们 可 以 根据 需要 来 使 用 。 

2. 物理 层 

这 里 不 打算 介绍 物理 层 的 细节 。 简 而 言 之 ， 品行 iets. gee ( 即 
每 次 只 能 使 用 单 向 传输 ) 传输 信息 。 使 用 数据 选 通 (STRB) 信号 来 控制 数据 流 。- 

数据 使 用 不 归 零 (non-return to zero, NRZ) 格式 传输 ， 每 当 两 个 连续 的 NRZ 值 具有 相 
同 的 值 时 STRB 发 生 改 变 。 这 种 机 制 可 以 很 容易 地 使 用 数据 和 选 通 信号 (通过 异 或 运算 ) 得 
到 时 钟 信号 。 图 4-67 提供 了 数据 信号 序列 10110001 编码 的 例子 。 


> 


提取 的 z= I 
epee det A 


图 4.67 火线 上 的 数据 格式 
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Al TPB (WA B), 来 为 每 个 方向 提供 传输 路 径 。 TPA All TPB 的 数据 路 径 和 选 通路 径 交 叉 。 
这 样 的 安排 不 同 寻常 ， 双 绞 线 中 有 数据 信和 号， 而 选 通信 号 属于 另 一 条 通道 。 
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产生 什么 后 果 。 然 而 ， 由 于 必须 处 理 电 方面 和 逻辑 方面 的 连接 ;这 不 是 一 件 让 事 。 必 须 
设计 连接 器 和 插入 处 理 机 制 使 信号 以 正确 的 顺序 连接 。 例 如 ， 接 地 连接 通常 是 首先 需要 
做 的 。 某 些 引 脚 可 能 比 其 他 的 要 长 以 确保 首先 被 连接 ， 比 方 说 ， 地 线 。 这 样 可 以 确保 消 
除 静 电荷 并 向 其 余 连 接 器 提供 参考 电压 。 通 常 ， 信 和 号 以 正确 的 顺序 连接 是 重要 的 ， 且 使 
| 用 延迟 电路 来 确保 在 剩余 电路 启动 并 运行 后 才 完 成 关键 连接 。 特 别 是 三 态 总 线 驱动 器 在 
驱动 总 线 时 ， 在 正确 地 激活 它们 之 前 必须 关闭 。 

热 插 拔 也 可 以 应 用 到 硬盘 驱动 器 。 这 对 高 可 靠 的 RAID 存储 系统 来 说 非常 重要 ， 在 
| 不 需要 断 电 从 而 不 会 出 现 系统 不 可 用 的 情况 下 ， 系 统 中 失效 的 磁盘 驱动 器 就 可 以 被 取 

出 ， 然 后 添加 一 个 新 的 驱动 器 。 


ieee hehehehehe hres otra ion initia 


IEEE 1394 的 硬件 

1394 总 线 使 用 六 线 (six-element) 电缆 。 有 两 对 扭曲 在 一 起 的 数据 导线 (提供 了 两 
个 独立 的 数据 通道 ) 以 及 两 条 供电 线路 。 第 了 人 站 导管 环绕 内 部 的 :6 个 导体 以 屏蔽 整个 电 
缆 线 。 


扭曲 线 对 A (TPA) 





扭曲 线 对 B (TPB) | 
”有 两 种 类 型 的 1349 总 线 连接 器 : ARH, RRR RR T RADE, 而 | 
| co 6h ak ake te) ie RR LOR SADE RESA WR EAU RES 
| 作 在 3.3V 或 5V 的 大 多 数 设 备 来 说 是 较 高 的 电压 )。 下 图 显示 了 这 些 连接 器 ， 比 USB 连 
接 器 的 价格 要 昂贵 。 = 





Mikkel Paulson 
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3. 仲裁 

串 行 总 线 实现 了 多 种 形式 的 仲裁 ( 背 板 串 行 总 线 上 的 仲裁 与 电缆 总 线 上 的 仲裁 被 区 别 
RF). “这 里 介绍 公平 仲裁 (fair arbitration), 它 发 生 在 电缆 总 线 主 。 该 仲裁 是 基于 地 理 位 置 
(geographic) 的 仲裁 ， 因 为 电缆 上 靠近 根 节点 的 节点 总 是 获胜 。 

公平 仲裁 协议 基于 公平 时 间 间 隔 (fairness interval) 的 概念 ， 它 由 一 个 或 多 个 总 线 活动 
时 间 间 隔 组 成 并 由 间 院 分 开 。 该 间隙 包括 短 的 、 被 称 为 子 处 理 间 陈 ;(subaction gap) 的 空闲 
时 间 和 较 长 的 、 被 称 为 仲裁 复位 间隙 ( arbitration reset gap) 的 空闲 时 间 。 在 每 个 子 处 理 间 
阶 ， 总 线 仲裁 决定 下 一 个 传输 异步 数据 包 的 节点 a 图 4-68 说 明了 这 个 概念 5 


第 入 个 公平 间隔 时 间 







子 处 理 间 隙 
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仲裁 复位 间隙 
图 4-68 ”火线 的 仲裁 协议 


当 使 用 公平 仲裁 时 ,活跃 的 节点 可 以 在 每 个 公平 时 间 间 隔 启 动 ， 发 送 一 次 异步 数据 包 。 
一 个 活跃 节点 只 有 当 arb_enable 信 号 被 置 位 时 才能 进行 仲裁 。arb_enable 信号 在 仲裁 复位 间 
隙 内 被 设置 为 1， 然 后 在 节点 赢得 仲裁 时 被 清 零 。 这 样 可 以 禁止 在 公平 时 间 间 隔 的 剩余 时 间 
内 进一步 发 出 仲裁 请 求 :: 当 最 终 公 平 的 节点 完成 仲裁 后 ;公平 时 间 间 隔 结束 ; 此 时 由 于 所 有 
节点 现在 都 使 其 arb_enable 信号 复位 并 且 不 能 驱动 总 线 ， 因 此 需要 arb_reset_gap( 仲 裁 复位 
间隙 )。arb_reset_gap 重新 使 能 所 有 卡 上 的 仲裁 ， 开 始 下 一 轮 公 平时 间 间 隔 。 该 过 程 如 图 .4-69 
所 示 。 


仲裁 复位 仲裁 复位 
间 险 Tape 
第 个 公平 间隔 时 间 | 





节点 A 的 arb_enable 信号 ye Tete Xe ee ea oe 

节点 B 的 arb enable 信号 de ea E 

节点 C 的 arb_enable 信 号 i ee oe 
图 4-69 公平 仲裁 


背 板 环境 还 支持 二 种 紧急 仲裁 的 形式 ， 它 允许 某 个 节点 获得 超过 其 公平 份额 的 总 线 时 
间 。 然而， 要 求 紧急 仲裁 的 节点 不 允许 长 期 使 用 总 线 。 
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4. 初始 化 

串 行 总 线 上 的 节点 不 需要 开关 来 选择 其 地 址 ， 因 为 寻 址 可 以 被 自动 和 动态 处 理 。 每 当 一 
个 节点 连接 到 总 线 ， 总 线 复位 信号 使 得 所 有 节点 进入 清除 所 有 拓扑 信息 的 状态 。 最 初时 ， 节 
点 知道 的 唯一 信息 是 它 是 一 个 分 支 节点 、 一 个 叶子 节点 、 还 是 被 隔离 ( 非 连接 状态 ) 的 。 

初始 化 后 ， 串 行 总 线 拓扑 被 认为 是 一 种 树 形 结构 ， 其 中 某 个 节点 被 当成 是 根 节 点 ， 所 有 
物理 连接 都 有 一 个 与 其 相关 联 的 方向 指向 根 节点 。 通 过 将 每 个 连接 的 端口 标记 为 父亲 端口 
(parent， 连 接 到 离 根 节点 更 近 的 结 点 ) 或 孩子 端口 ( child， 连 接 离 根 节点 更 远 的 结 点 ) 来 设 
置 方向 。 通 过 配置 tree-ID 进程 中 的 超时 (time-out) 可 以 检测 到 拓扑 结构 中 所 有 的 循环 。 如 
果 某 结 点 与 之 相连 的 所 有 端口 都 被 标识 为 孩子 端口 ， 则 该 节点 为 根 节点 。 

下 一 步 是 给 每 个 节点 一 个 机 会 来 选择 唯一 的 物理 ID 以 识别 其 自身 。 通 过 以 基准 速率 向 
电缆 发 送 1 ~ 4 个 非常 短 的 数据 包 来 完成 自 定 ID 的 发 送 ， 其 内 容 包 括 物理 ID 及 一 些 管理 信 
息 。 物 理 ID 非常 简单 ， 就 是 某 节 点 在 发 送 其 自 定 ID 之 前 ,经 过 接收 自 定 ID 信息 状态 的 次 
数 ( 即 第 一 个 节点 发 送 自 定 ID 数据 包 选 择 0 作为 其 物理 ID ， 第 二 个 选择 1， 依 次 类 推 )。 识 
别 过 程 从 树 的 根 节点 开始 。 在 树 根 下 的 每 个 节点 ， 具 有 最 低 编号 的 端口 被 首先 测试 。 注 意 ， 
节点 不 需要 解码 自 定 ID 包 ， 它 仅仅 需要 计算 总 线 复位 以 来 的 自我 识别 序列 的 数量 。 

管理 信息 包含 在 自 定 ID 包 中 ,包括 设置 间隔 计时 器 的 代码 、 打 开 连 接 的 链 路 层 所 需要 
的 能 量 、 不 同 端口 的 状态 (未 连接 、 已 连接 到 孩子 以 及 已 连接 到 父亲 )， 以 及 数据 传输 速率 
的 限制 。 

Ae ID 过 程 使 用 确定 性 选择 过 程 ， 其 中 根 节 点 将 对 介质 的 控制 权 传输 给 连接 到 它 的 且 
具有 最 小 编号 的 连接 端口 ， 然 后 等 待 该 节点 发 出 ident done 信号 ， 表 明 它 和 其 所 有 的 孩子 
都 识别 耶 自 己 。 根 结 点 然后 将 控制 权 传递 给 下 一 个 具有 最 小 编号 的 端 日 ， 然 后 等 待 该 节点 完 
成 5 当 连 接 到 根 节点 的 所 有 端口 的 结 点 都 完成 后 ; 根 节点 完成 自我 识别 a 子 节 点 使 用 相同 的 
方式 以 递归 形式 完成 识别 > 

5. 链 路 层 

链 路 层 使 用 其 下 面 的 物理 层 的 服务 ， 在 节点 之 间 通 过 数据 包 的 形式 传输 信息 。 数 据 可 以 
通过 向 特定 的 地 址 发 送 数据 包 并 接收 确认 的 方式 实现 异步 (asynchronously) 传输 。 数 据 也 
可 以 通过 发 送 固定 长 度 的 数据 包 序 列 的 方式 实现 同步 〈isochronously) 传输 ， 这 种 方式 简化 
了 寻 址 并 且 没 有 确认 3 
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RITAR FA A A Hk BR, WR Rr 
码 (BP CRC). 

下 一 节 将 介绍 通用 串 行 总 线 (universal serial bus, USB). RYJ, USB 是 火线 的 一 种 低 
成 本 的 版 本 ， 以 非常 低 的 成 本 提供 较 低 的 数据 传输 率 和 缩减 的 性 能 。 火 线 主要 用 于 摄像 机 ， 
USB 主要 用 于 键盘 和 上 鼠标。 然而，USB 标准 的 逐步 改进 给 予 了 火线 致命 的 打击 。 


4.9.3 USB = 


我 认为 ， 对 个 人 数字 革命 (包括 台式 计算 机 、 便 携 计 算 机 、 笔 记 本 、MP3 播放 器 、 数 码 
相机 以 及 手机 ) 成 功 贡 献 最 大 的 是 闪存 (flash memory) 和 通用 串 行 总 线 (USB). WAHE 
了 健壮 的 、 高 密度 、 小 尺寸 、 低 价格 的 非 易 失 性 存储 ， 而 USB 技术 允许 用 户 将 几乎 所 有 的 
现代 数字 设备 连接 至 计算 机 一 一 其 至 可 以 不 需要 主机 就 将 两 个 数字 设备 连接 在 一 起 (例如 相 
机 和 打印 机 )。 事 实 上 ，USB 是 有 史 以 来 最 成 功 的 数字 接口 ， 到 2009 年 , 已 经 售 出 了 超过 
10 亿 件 USB 设备 。 本 节 将 对 USB 进行 概述 。 
















USB 的 历史 > 

USB 由 Compaq, DEC, TBM. Microso ts NEC 和 ee 1994 REAR. 第 
一 个 USB 规范 ，USB 1.0, 在 .1996 年 提出 ， 支持 的 数据 传输 迷 率 为 12Mb/s。 USB 1.1 
在 1998 年 发 布 ， 主 要 解决 了 集线器 相关 的 问题 。USB 1.1 被 广泛 采纳 。 
2000 年 ， 出 现 了 USB 2.0， 它 提供 的 最 大 数据 传输 率 为 480Mb/s。USB 扩展 至 火线 
的 传统 领域 ， 成 为 大 多 数 PC 与 打印 机 、 ARBAB. 键盘 、 饼 标 等 设备 的 接口 事实 上 
(defacto) 的 标准 。 

2009 年 ， 出 现 了 USB 3.0， 可 以 提供 
XBAFEK AER EAE ORM I 
i 新 的 电缆 格式 和 技术 。 8 










BA Cp 2400Mb/s) 的 工作 速度 ， 取 代 了 
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通用 串 行 总 线 (USB) 由 许多 公司 联合 研发 ， 后 来 成 为 标准 接口 。 从 本 质 上 讲 ，USB 总 
线 使 用 低 成 本 的 连接 器 和 电线 实现 计算 机 与 各 种 外 围 设 备 的 连接 ， 从 鼠标 / 键盘 /打印 机 7 
扫描 仪 到 如 外 部 硬盘 和 闪存 设备 (所 谓 的 随身 驱动 器 ) 等 存储 设备 。 在 许多 方面 ,USB 都 是 
火线 的 蔡 代 品 。 

USB 由 主机 控制 (host controlled); 也 就 是 说 ， 不 像 其 他 的 总 线 (如 PCI、VMEbus 或 
NuBus)， 它 不 支持 多 个 主 设备 这 种 安排 = 每 条 总 线 只 能 有 一 个 USB ERK (host, REH). 
图 4-70 描述 了 USB 系统 的 分 层 星 形 (tiered star) 拓扑 结构 。 

图 4-70 中 层次 结构 的 顶层 是 主机 ,， 它 与 计算 机 通信 并 控制 USB 总 线 。 主 机 连接 到 集 线 
器 ， 它 是 将 USB 总 线 分 配给 层次 结构 中 更 低层 次 的 一 种 设备 。 集 线 器 可 以 直接 连接 到 一 个 
外 围 设 备 (图 4-70 中 标记 为 功能 ( function))、 几 个 外 围 设备 或 者 男 一 个 集线器 。 每 个 集 线 
器 可 能 会 连接 到 更 低层 次 的 集线器 ， 如 图 4-70 所 示 。 集 线 器 可 能 是 一 个 单独 的 设备 (例如 ， 
是 一 个 USB 端口 扩展 器 ， 具 有 一 个 输入 和 多 个 输出 )， 或 者 可 以 被 内 置 到 键盘 、 显 示 器 、 其 
至 是 外 部 磁盘 系统 中 。 

1. 前 两 代 USB 

USB 始 于 20 世纪 90 年 代 中 期 版 本 1.0 和 1.1 提供 的 速度 为 12Mb/s (全 速 模 式 ) 和 
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1.5Mb/s (低速 模式 )。USB 2.0 WRF 2000 4F HEH, E 480Mb/s (高 速 )， 以 及 12Mb/s 和 
1.5Mb/s 这 两 种 速度 。USB 总 线 的 2.0 版 本 与 早期 版 本 兼容 。 由 于 2.0 版 本 的 性 能 远 远 胜 于 
1.1 版 本 ， 这 里 不 讨论 早期 版 本 。 
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4-70 USB 总 线 拓扑 


2. 电 特 性 

USB 使 用 简单 的 多 芯 连 接 器 与 专用 连接 器 相连 。 然 而 ， 由 于 USB 的 引入 ， 外 围 设备 
变 得 越 来 越 小 ，USB 电缆 被 迫 遵循 这 一 趋势 ， 结 果 是 现在 有 4 种 基本 尺寸 。 图 4-71 显示 了 
USB 插头 和 插座 。 链 路 的 计算 机 端 使 用 A 型 插座 和 了 B 型 插头 ， 使 用 这 种 实现 方式 的 设备 的 
数量 相当 可 观 。B 型 插头 和 揪 座 在 链 路 的 另 一 端 使 用 〈 即 在 集线器 或 外 围 设备 如 打印 机 这 一 
端 )。 迷 你 B 型 (Mini-B) 插头 和 插座 为 数码 相机 、 手 机 和 便携 式 磁盘 驱动 器 研发 。 图 4-72 
给 出 了 USB 插头 的 照片 ， 图 4-73 展示 了 USB 系统 的 结构 。 


EJ cy = 
TypeA MiniA Micro-A 
a = 
USB tE TypeB MiniB Micro-B 


图 4-71 USB 连接 器 


USB 电缆 使 用 4 根 导管 。 数 据 在 标记 为 DEA D- 的 二 对 双 绞 线 中 以 不 同 的 方式 传输 ， 
如 图 4-74 所 示 。 前文 曾 谈 到 差 动 模式 传输 可 以 通过 拒绝 共 模 干扰 来 增加 可 靠 性 (在 两 条 线 
上 的 感应 电压 不 会 影响 导线 之 间 的 电位 差 )。 双 绞 线 被 封闭 在 金属 保护 屏 中 ;以 进一步 降 
低 读 取 杂 散 信号 的 风险 。 电 缆 的 最 大 长 度 为 Sm。 当然 ， 可 以 在 Sm 处 使 用 集线器 来 增加 
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日 ”如 果 在 1.5Mb/s 的 低速 模式 下 使 用 USB 连接 ， 用 户 可 以 使 用 简单 的 最 大 长 度 为 3m 的 非 屏蔽 线 和 非 双 绞 线 。 


RA oo 7 


USB 路 径 的 长 度 。 






Alan Clements 


A 型 插座 





B 型 插座 
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图 4-73 USB 机 械 环 境 


数据 路 径 
( 差 动 对 ) 
地 线 


内 部 保护 ( 屏 ) 
外 部 保护 ( 屏 ) 





a) USB 电缆 的 切面 


电源 电源 
D+ D+ 
D- D- 
地 线 地 线 


b) USB 电缆 
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图 4-74 USB 电缆 


ESMER FR 
USB RARMRE HRS, 其 目的 是 支持 集线器 和 和 饼 标 与 键盘 等 外 国 设备 。 在 实 
, 了 这 一 优势 。 如 ， 充 电器 内 置 的 USB 可 以 为 手机 和 MP3 播放 器 充电 。 






”一 种 被 称 为 电池 充电 ( battery charging) 的 新 电源 模式 被 添加 至 USB 规范 中 。 在 这 
种 模式 下 ， 主机 可 以 在 以 12Mb/s 通信 时 提供 高 达 1.5A 的 电流 ， 或 者 在 以 480Mb/s 通信 
“时 提供 0.9A 的 电流 。 此 外 ， 到 2010 年 ， PRES FAS HABLA ME USB 接口 
“对 其 手机 进行 充电 。 f 
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USB 电缆 包括 两 个 独立 的 供电 线 ， 为 远程 设备 (例如 ， 和 鼠标 或 键盘 ) 提供 电流 2。USB 
外 围 设备 可 以 由 总 线 供电 (bus-powered) 或 自 供电 ( self-powered)。 今 天 ,许多 移动 硬盘 可 
以 连接 到 USB 插座 而 完全 不 需要 使 用 USB BA. 在 具有 多 个 集线器 的 USB 系统 中 ， 必 须 
管理 能 量 的 分 配 。USB 供电 线 工作 在 0 一 5V， 可 提供 的 最 大 电流 为 S00mA。 如 果 集 线 器 是 
总 线 供 电 的 ， 它 可 以 为 所 有 下 游 端口 提供 总 共 500mA 的 电流 。 如 果 集 线 器 是 自 供 电 的 ， 它 
可 以 为 每 个 下 游 端口 提供 最 大 500mA 的 电流 。 设 备 不 可 以 从 USB 获得 超过 100mA 的 电流 ， 
直到 它 已 在 一 个 称 为 列举 (enumeration) 的 过 程 被 主机 识别 。 

USB 连接 器 是 可 热 插 拔 的 (hot-pluggable); 也 就 是 说 ， 用 户 可 以 在 主机 系统 不 断 电 的 情 
况 下 插 拔 外 围 设备 。 

3. 物理 层 数据 传输 

在 电 平 层 面 ，USB 采用 NRZ 编码 ， 其 中 逻辑 1 被 表示 为 不 改变 电 平 ， 而 逻辑 0 被 表示 
为 改变 电 平 。 发 送 一 串 0 需要 最 大 的 带宽 ， 发 送 一 串 1 导致 恒定 的 电 平 且 没有 信号 转换 。 图 
4-75 显示 了 NRZI 序 列 ($ PCIe 总 线 使 用 的 8b/10b 编码 相 比 ， 该 编码 格式 非常 古老 ， 由 于 
非 自 同步 且 具 有 直流 偏差 而 相对 较 少 使 用 )。USB 总 线 上 的 两 种 信号 水 平 被 称 为 J 和 KK。 
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图 4-75“ NRZI 编码 


由 于 一 长 串 的 1 意味 着 在 总 线 上 根本 没有 信和 号 转换 ， 使 用 称 为 位 填充 〈bit stuffing) 的 
技术 可 以 确保 电 平 转换 的 最 大 间隔 。 在 NRZI 编码 前 ， 每 6 个 连续 的 1 后 将 自动 插入 一 个 
0。 在 接收 端 ， 至 少 每 7 位 一 个 周期 中 确保 会 出 现 三 次 转换 ， 这 足以 保持 收发 同步 。 由 于 每 
6 个 连续 的 1 后 面 都 跟着 一 个 0， 接收 方 简单 地 在 6 个 1 后 面 删除 0 。 

4. 逻辑 层 

USB 总 线 通 信 发 生 在 主机 和 外 围 设备 之 间 。 催 辑 上 ， 主 机 和 设备 之 间 存 在 通信 信道 ， 
从 USB 的 角度 上 说 ， 此 通道 称 为 管道 (pipe)s USB 主 机 在 任何 时 刻 都 可 以 支持 32 个 活跃 
的 管道 (16 个 向 上 管道 和 16 个 向 下 管道 )。 管 道 以 外 围 设备 为 端点 (endpoint) 终止 。 虽 
IR USB 系统 的 物理 结构 是 分 层 星 形 结构 ( 即 具有 二 个 中 央 节 点 ， 其 他 节点 都 与 之 相连 , 任 
意 节点 都 可 以 是 局 部 节点 的 中 心 )， 它 在 逻辑 上 (logically) 是 星 形 网 络 ( star network)， 见 
图 4-76。 所 有 节点 必须 通过 单个 中 央 节 点 相互 通信 。 





O 火线 有 两 个 版 本 一 一 支持 供电 ; 不 支持 供电 。 

”位 填充 最 出 名 的 是 在 HDLC 传输 中 使 用 ， 它 使 用 一 串 6 个 1 作为 令 牌 或 标志 。 为 了 防止 在 数据 流 中 出 现 令 
牌 , 每 5 个 1 个 后 面 需 要 插入 一 个 0。 在 接收 端 ， 标志 被 清除 (因为 它们 仅仅 是 6 个 1 的 序列 ) 然后 每 5 个 
1 个 后 面 的 0 被 删除 ， 由 于 它 必定 为 一 个 填充 的 0。 
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a) 物理 拓扑 结构 (分 层 星 形 ) ; b) 逻辑 拓扑 结构 〈 星 形 网 络 ) 
图 4-76 USB 物理 与 逻辑 拓扑 


当 用 户 第 一 次 将 USB 设备 插入 集线器 ， 主 机 开始 识别 过 程 ( 即 列举 ，enumeration)， 该 
过 程 中 新 设备 被 复位 ， 为 设备 分 配 地 址 ， 并 读 取 其 信息 。 主 机 控制 器 以 主 从 模式 工作 ， 轮 询 
USB 网 络 中 每 个 设备 上 的 数据 。USB 是 一 种 轮 询 总 线 ， 缺 乏 中 断 请 求 机 制 。 

信息 以 报 文 (packet) 的 形式 发 送 ， 它 可 能 是 令 牌 报 文 、 数 据 报 文 或 握手 报 文 。 当 主机 
发 送 (广播 ) 一 个 令 牌 报 文 9 时 开始 USB 事务 ， 该 报 文 定义 了 当前 事务 的 类 型 和 方向 、 接收 
方 的 设备 地 址 以 及 设备 的 端点 号 。 然 后 根据 令 牌 中 指定 的 方向 开始 实际 的 数据 传输 。 事 务 完 
成 后 ， 数据 的 接收 方 发 送 一 个 握手 报 文 表示 数据 已 被 接收 。 





USB 支持 4 种 类 型 的 数据 传输 ; 控制 传输 、 批 量 数据 传输 、 同 步 传输 和 中 断 数据 传输 。 
控制 传输 执行 设备 的 配置 和 状态 从 信息 的 读 取 等 操作 。 批 量 传输 模式 是 用 于 大 批量 数据 的 传 


© 令 牌 (token) 这 个 术语 来 自 具有 环形 拓扑 结构 的 串 行 数据 链接 。 为 了 各 免 冲 突 ， 只 有 一 个 节点 具有 称 为 令 牌 


的 报 文 。 如 果 该 节点 需要 继续 工作 ， 则 必须 具有 令 牌 。 如 果 它 不 想 使 用 环 ， 就 将 令 牌 沿 着 环 路 传递 到 下 一 个 
节点 。 该 概念 来 自 于 单行 线 蒸汽 机 车 的 调度 方法 。 单 行 线 只 允许 有 一 个 令 牌 ( 铃 销 )， 工 程 师 将 用 它 来 确保 没 
有 其 他 的 机 车 可 以 使 用 这 段 轨道 。 
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送 ， 数 据 由 3 段 组 成 : 令 牌 报 文 、 数 据 报 文 (最 多 512 字 节 ) 以 及 握手 报 文 。 批 量 传输 是 可 
靠 的 ， 它 采用 了 检 错 码 ， 并 可 以 对 丢失 的 数据 进行 处 理 。 

同步 传输 模式 是 一 种 尽力 而 为 (best effort) 的 方式 ， 使 用 的 数据 报 文 最 大 为 1024 字 节 。 
其 中 没有 握手 阶段 ， 因 此 传输 是 没有 保障 的 ( 即 尽力 而 为 的 服务 )。 该 模式 支持 24MB/s 的 最 
大 带宽 ， 主 要 用 于 音频 流 或 视频 流 之 类 的 应 用 。 

使 用 中 断 传送 方式 的 设备 将 会 周期 性 地 传输 数据 ， 例 如 鼠标 或 键盘 。 该 模式 具有 有 限 的 
延迟 (bounded latency， 即 最 坏 情 况 下 的 值 )， 包 括 由 令 牌 / BF! ae me 3 个 阶段 。 


USB OTG 
”USB 2.0 不 支持 点 对 点 (on aie) 网 络 ; 它 as 外 网 设备 的 通信 = 
机 通常 是 一 台 计算 机 。 今天 ， 需要 外 部 通信 的 设备 范围 相当 RA, GA e R 
手机 、 MP3 播放 器 、 再 到 视听 系统 。 实现 基于 主机 的 系统 (例如 ， 
打印 图 像 ) 并 不 总 是 十 分 方便 。 ae 
USB 的 OTG (On-The-Go) 模式 是 一 种 P2P (点 对 点 ) 协议 ， chm USB 设备 
在 没有 主机 参与 的 情况 下 通信 ， 提 供 了 设备 间 的 直接 通信 。OTG RHF 2001 #12 A 
.被 USB 2.0 al 修订 版 采纳 。 该 USB 的 扩展 版 支持 几 个 OTG 设备 之 间或 OTG 设备 和 伟 
统 的 USB 主机 之 间 的 通信 。 该 修订 也 引 AT 新 的 称 为 Micro-A 和 Micro-B 的 USB 插头 
和 插座 。 修订 的 标准 引入 了 双重 角 色 的 设备 (例如 ，OTG)， 它 距 可 以 作为 主机 也 可 以 作 
-为 外 围 设备 。 此 外 ， 双重 角 色 设备 必须 能 够 向 总 总 线 提供 至 少 8mA 的 电流 (注意 ， 大 多 数 
”0TG 设备 是 由 电池 供电 的 )。 
Ze OTG 设备 作 为 主机 Ha 可 以 仅仅 支持 a de 外 围 设备 列 Es pe peripheral 
list); 也 就 是 说 ，OTG 设备 可 能 只 与 某 些 指定 的 外 设 一 起 工作 ， 因此 它 并 不 是 具有 完整 
的 、 通 用 的 USB 功能 的 主机 。OTG 技术 的 重要 组 成 是 主机 协商 协议 (Host et 
Protocal, HNP), TAHAN OTG 设备 之 间 传输 控制 。 ae 








5. USB 3.0 

USB 最 彻底 的 改变 发 生 在 2010 年 一 一 USB 3.0 的 引入 ， 它 使 性 能 增加 了 107%, AREF 
更 低 。 更 重要 的 是 ，USB 3.0 与 USB 2.0 兼 容 。USB 3.0 十 分 有 趣 ， 因 为 它 并 不 是 USB 2.0 
的 发 展 或 延伸 ， 而 是 与 USB 2.0 同时 存在 的 蔡 换 总 线 (replacement bus); 也 就 是 说 ，USB 3.0 
总 线 包含 了 USB 2.0 总 线 。 图 4-77 说 明了 USB 3.0 电缆 的 结构 。USB 2.0 中 的 两 个 数据 导 
管 和 两 个 供电 线 被 保留 。 新 增 了 两 个 新 的 差分 导体 对 (SSRX 和 SSTX) 来 以 全 双 工 模式 传 
输 新 的 USB 3.0 的 数据 。USB 3.0 附加 的 功能 被 称 为 超速 (SuperSpeed) 总 线 ， 提 供 4.8Gb/s 
的 最 大 速度 。 举 例 来 说 ，USB 2.0 需要 13.9min 来 传输 一 部 高 清 电影 ， 而 USB 3.0 可 以 在 
70s 内 完成 相同 的 传输 。 简 而 言 之 ，USB 3.0 是 令 人 印象 深刻 的 工程 壮举 ， 在 功能 和 性 能 方 
面 迈 出 于 一 大 步 ， 同 时 保持 对 现 有 巨大 的 USB 2.0 用 户 市 场 的 向 后 兼容 。 

USB 3.0 与 USB 2.0 兼容 ， 用户 可 以 在 主机 上 的 USB 3.0 插座 中 插入 USB 2.0 设备 ， 该 
连接 行为 完全 像 一 个 传统 的 USB 2.0 总 线 ; 也 就 是 说 ，USB 3.0 默认 为 USB 2.0。 这 种 机 制 
的 关键 在 于 插头 和 插座 的 安排 。USB 2.0 插头 具有 与 插座 匹配 的 小 板 ， 其 一 面 有 4 个 连接 器 。 
USB 3.0 有 两 排 连接 器 一 一 一 排 与 USB 2.0 标准 的 完全 匹配 ， 另 一 排 提 供 4 个 新 的 USB 3.0 
信和 号 加 上 地 线 连接 。 换 句 话 说 ，USB 3.0 提供 了 真正 的 双 总 线 机 制 ， 一 个 与 USB 2.0 相同 ， 
一 个 为 新 的 SuperSpeed 总 线 。 
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图 4-78 从 协议 层次 说 明了 USB 3.0 总 线 的 逻辑 结构 (类似 ISO 开放 系统 互 连 的 七 层 模 
型 )。 类 似 于 PCIexpress 总 线 ，SuperSpeed 总 线 将 所 有 新 功能 添加 至 USB 3.0， 它 在 物理 层 使 
用 8b/10b 编码 。 数 据 以 扰 码 (scambled) 的 形式 在 超级 总 线 (SuperBus) 上 传输 。 这 不 是 一 种 
安全 机 制 ， 而 是 一 种 将 数据 转化 为 随机 性 的 序列 ， 其 目的 是 为 了 提高 数据 链 路 的 电气 特性 。 
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图 4-77 USB3.0 电缆 
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图 4-78 USB 3.0 协议 层 
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图 4-78 演示 了 主机 和 设备 之 间 通 过 集线器 的 端 到 端 通信 。USB 2.0 使 用 集线器 扩展 网 
络 。 用 户 可 以 购买 具有 一 个 连接 至 主机 的 输入 和 多 个 输出 的 USB 集线器 ， 或 者 可 以 使 用 这 
样 的 设备 ， 例 如 ， 视 频 显 示 器 可 以 有 共有 连接 至 计算 机 的 USB 端口 ;另外 还 有 2 个 或 3 个 可 
以 连接 鼠标 等 设备 的 扩展 USB 端口 。USB 2.0 集线器 简单 地 将 其 输入 端口 上 的 所 有 消息 传递 
到 所 有 的 输出 端口 。USB 3.0 SuperSpeed 集线器 的 工作 更 有 效 ， 它 将 报 文 在 主机 和 参与 通信 
的 设备 间 进 行 传输 。 集 线 器 还 可 以 实现 SuperSpeed 报 文 的 存储 和 转发 ( store and forward). 
图 4-78 中 重要 的 一 点 是 ;USB 3.0 具有 复杂 的 分 层 通信 协议 ， 因 此 ， 任 何 层 的 改变 或 改进 都 
可 以 不 影响 系统 ; 也 就 是 说 ，USB 3.0 的 发 展 还 有 空间 。 
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本 章 的 主题 是 输入 /输出 (1O)。 这 个 话题 常常 被 忽视 ， 大 家 更 喜欢 处 理 器 和 指令 集体 
系 结构 的 魅力 。 然 而 ， 没 有 今天 计算 机 的 高 水 平 连接 ， 人 们 将 不 会 看 到 个 人 计算 和 无 处 不 在 
的 计算 的 快速 增长 。 现 代 计 算 建 立 在 三 大 支柱 之 上 : 低 成 本 、 低 功 耗 、 高 性 能 的 处 理 器 ， 闪 
存 ， 以 及 包括 USB 和 WiFi 在 内 的 互 连 能 力 。 

本 章 首先 介绍 了 输入 / 输出、 缓冲 数据 和 握手 的 核心 概念 ， 还 讨论 了 信息 进出 计算 机 的 
3 种 策略 : 程序 驱动 的 轮 询 、 中 断 驱 动 的 1/0 以 及 高 速 的 直接 存储 器 访问 DMA。DMA 在 外 
围 设备 和 存储 器 之 间 直 接 传输 数据 。 

本 章 的 核心 是 总 线 ， 它 是 处 理 器 与 其 存储 器 和 外 设 之 间或 者 处 理 器 与 其 他 处 理 器 之 间 的 
关键 高 速 通路 。 与 其 他 计算 机 组 件 一 样 ,总 线 具 有 悠久 的 发 展 和 进步 历史 。 本 章 介绍 了 总 线 
设计 中 的 几 个 问题 ， 特 别 是 ， 各 种 设备 竞争 或 仲裁 访问 总 线 的 方式 。 

本 章 的 最 后 一 部 分 介绍 了 串 行 总 线 ， 它 是 现代 的 奇迹 ， 让 用 户 几 乎 可 以 将 所 有 东西 插入 
计算 机 而 不 必 担 心 电 气 接口 或 数据 传输 方式 。 


习题 

4.1 外 部 接口 芯片 可 能 有 几 个 内 部 寄存 器 。 请 解释 现 有 可 以 减少 访问 这 些 寄存 器 所 需 地 址 线 的 技术 。 
你 能 想到 (本 文中 没有 讨论 的 ) 可 以 允许 n 条 地 址 线 选择 超过 2” 个 寄存 器 的 技术 吗 ? 

4.2 某 计 算 机 花费 其 80% 的 时 间 执 行 用 户 代 码 ，20% 的 时 间 执 行 输入 / 输出 操作 。 如 果 认 为 IO 是 不 
必要 的 开销 ， 计 算 机 的 效率 是 80/(80+20)=80%。 
假设 CPU 性 能 每 年 综合 增加 40%， 而 1O 系统 性 能 每 年 综合 增加 10%。 两 年 以 后 ， 可 以 买 到 新 
的 具有 更 快 的 处 理 能 力 和 1/O 性 能 的 计算 机 。 两 年 后 ， 新 计算 机 的 效率 如 何 ? 

4.3” 某 计算 机 具有 中 断 驱 动 的 WWO， 其 中 断 响应 时 间 为 4ps( 即 它 需 要 4hs 来 调用 中 断 处 理 程序 ;并 开 
始 执行 目标 代码 )。 同 样 ， 它 需要 2hs 从 中 断 返 回 ， 并 重新 开始 执行 被 中 断 的 程序 。 
a. 如 果 这 人 台 计 算 机 每 ks 执行 10 条 指令 ， 中 断 处 理 程 序 为 10 条 指令 长 ， 中 断 处 理 的 效率 如 何 ? 
b. 如 果 中 断 处 理 的 效率 约 为 80%， 中 斯 处 理 程序 应 为 多 长 〈 用 指令 数 表示 ) ? 

44 VO 系统 使 用 DMA ， 在 外 围 设备 开始 请 求 到 开始 数据 传输 之 间 具 有 10ms 的 延迟 。 该 系统 的 数 
据 传输 速率 为 1B/hs。 在 下 面 两 种 情况 下 ， 该 方法 可 以 达到 的 最 高 效率 是 多 少 ? 
a. 数据 以 IKB 大 小 的 块 进行 传输 ; 
b. 数据 以 10KB 大 小 的 块 进行 传输 。 

4.5 某 基 于 中 断 的 IO 系统 使 用 轮 询 中 断 处 理 ， 在 中 断 请 求 后 处 理 器 必须 询问 每 个 外 围 设备 的 中 断 状 
态 标 志 。 假 设 中 断 请 求 需 要 2us, PORE 1.5ns， 轮 询 中 断 请 求 者 需要 0.5ns。 中 汤 处 理 程 
序 需要 5ps。 如 果 中 断 必须 在 S0hs 内 被 响应 ， 可 以 支持 的 最 大 外 围 设备 数量 是 多 少 ? 
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4.6 


4.7 


4.8 


4.9 


该 问题 需要 读者 自己 进行 研究 来 了 解 1O 系统 的 性 能 变化 。 选 取 至 少 两 种 IO 总 线 ， 画 出 最 大 数 
据 传 输 速 率 与 时 间 的 函数 。 

如 果 为 地 球 上 的 所 有 大 均匀 分 配 以 太 网 地 址 ， 每 人 都 可 以 分 到 二 一 个 吗 ? 如 果 人 均 有 多 个 地 址 ， 每 
人 将 分 配 到 几 个 地 址 ? 

多 年 前 ， 某 计算 机 被 用 于 军事 和 航天 应 用 。 一 个 有 趣 的 特性 是 ， 它 没有 任何 形式 的 中 断 处 理 机 
制 。 你 认为 为 什么 设计 者 会 向 这 个 决定 ? 

假设 某 计算 机 系统 有 4 个 中 断 设备 ，P1 Ph SOP PI 具有 最 高 优先 级 ，P4 具有 最 低 优先 级 。 
设计 一 个 具有 4 个 中 断 请 求 输 大 (PL 一 P4) 和 4 个 中 断 请 求 输出 (I1 ~ I4 ) 的 逻辑 单元 。 该 逻 
辑 应 该 将 P1 ~ P4 上 的 任意 组 合 转换 为 Il ~ I4 上 反映 出 最 高 优先 级 输入 的 单个 请 求 。 例 如 ， 如 
果 发 出 Pl 和 P3， 输 出 I1， 不 会 输出 I2 和 到。 假设 使 用 正 逻辑 ( 即 请 求 信 号 为 1 )。 


4.10 某 存储 器 映射 的 输入 设备 有 两 个 寄存 器 : 状态 寄存 器 和 输入 寄存 器 。 状 态 寄存 器 位 于 地 址 


4.16 
4.17 
4.18 


PeriAddress， 下 一 个 字 地 址 就 是 数据 寄存 器 。 输入 机 制 查询 状态 寄存 器 的 第 2 位， 然后 在 获得 
状态 位 时 读 取 数据 。 当 数据 元 素 被 读 取 ， 它 存储 在 一 个 简单 的 基于 指针 寻 址 的 表格 中 。 一 旦 输 
入 0 循环 将 退出 。 编 写 一 个 简单 的 循环 查询 过 程 将 数据 输入 至 表格 中 。 

开 环 和 闭环 数据 传输 的 优 缺 点 是 什么 ?如 果 为 特定 的 应 用 程序 必须 选择 某 种 方法 时 ， 你 会 考虑 
哪些 因素 ? 

USB 总 线 在 哪些 方面 比 RS232C 总 线 要 好 ? 

高 速 USB 2.0 端口 使 用 30% 的 可 用 带宽 。 使 用 总 线 来 读 取 包 含 700 幅 图 像 (每 幅 25MB) 的 闪 
存 卡 。 如 果 卡 不 是 限制 因素 ,需要 多 长 时 间 来 读 取 数据 ? 

a. 某 微 处 理 器 具有 优先 向 量 (prioritized vectored) 中 断 处 理 机 制 。 优先 和 向 量化 的 含义 是 什么 ? 
b. 中 断 处 理 系统 可 以 使 计算 机 更 容易 受到 恶意 软件 〈 例 如， 病毒 ) 的 威胁 吗 ? 如 果 是 这 样 ， 为 什 
么 ? 怎么 发 生 的 ? 

假设 你 正在 设计 一 款 专 用 的 IO 芯片 来 缓解 高 性 能 工作 站 上 的 IO 负担 。 你 将 向 计算 机 指令 集 添 
加 什么 特殊 指令 ? 如 果 有 的 话 ， 需 要 增加 哪些 额外 的 硬件 接口 ? 

在 IO 术语 中 ， 什 么 是 分 离 事务 (split-transaction)， 它 有 必要 吗 ? 

a. 为 什么 有 时 需要 双 缓 冲 输入 ? b. 在 什么 情况 下 LO 环境 中 FIFO 是 必需 的 ? 

图 P4.18 给 出 了 IEEE 488 总 线 的 数据 传输 时 序 图 。 该 总 线 最 初 设计 用 于 智能 自动 化 仪器 (实验 
室 ) 环境 。 多 个 异步 设备 可 以 连接 到 IEEE 488 总 线 。 并 不 是 所 有 的 设备 都 能 够 以 相同 的 速率 
运行 。 使 用 专利 保护 的 三 线 握手 来 实现 一 个 设备 和 多 个 接收 器 (488 术语 中 为 听众 “ listener”) 
之 间 的 通信 。 控 制 信号 采用 负 逻 辑 (0 状态 是 高 电 平 状 态 )， 由 集 电极 开路 门 驱动 (一 个 设备 可 
将 信号 线 驱 动 至 低 电 平 状 态 ) 。 控 制 数据 传输 顺序 的 3 个 控制 信号 为 没有 准备 好 接收 数据 ( not 
ready for data，NRFD ， 表 明 该 设备 当前 尚 无 法 接收 数据 )、 数 据 有 效 (data available, DAV, # 
明 发 送 者 已 经 准备 好 数据 ) 和 不 再 接收 数据 (no data accepted，NDAC， 表 明 接 收 方 已 经 收 到 数 
据 )。 记 住 ， 使 用 集 电 极 开 路 总 线 驱 动 实现 了 线 或 电路 ， 其 中 如 果 任 意 一 个 驱动 器 被 拉 至 低 电 
平 ,信号 线 将 被 拉 至 低 电 平 。 请 用 自己 的 话说 明 三 线 握手 是 如 何 工作 的 。 
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4.19 图 P4.19 中 的 时 钟 电路 是 一 个 仲裁 者 。 假 设 有 两 个 设备 ，1 和 2， 可 以 在 任何 时 刻 请 求 资源 ， 如 
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总 线 。 问 题 是 即使 两 个 请 求 同 时 发 生 ， 也 要 确保 只 有 一 个 请 求 者 获得 资源 。 设 备 2 的 电路 有 两 
个 请 求 输入 ， 加 一 个 时 钟 和 两 个 应 答 输出 。 说明 电 路 是 怎样 可 靠 地 执行 该 功能 的 。 注 意 ， 该 电 


路 采用 边沿 触发 触发 器 ， 不 会 产生 亚 稳 定性 (metastability ) 。 


Requestl 


时 钟 


Request2 
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Al. P4.19 


某 应 用 是 80% 计算 密集 型 的 ， 并 占用 计算 机 能 力 的 60% (包括 CPU 和 IO)。 假 设 由 于 更 新 ， 
该 应 用 程序 每 年 将 需要 20% 更 多 的 资源 ; 计算 机 处 理 能 力 每 年 增加 20% ; 而 计算 机 IO 的 性 能 
每 年 提高 5%。5 年 后 ， 处 理 能 力 和 I/O 使 用 的 情况 将 如 何 发 展 ? 

为 什么 IBM 微 通道 结构 在 商业 上 失败 了 ? 

假定 有 一 个 系统 ， 在 两 点 间 以 1024 字 节 的 数据 包 ( 报 文 ) 传输 数据 。 传 输 速率 为 1 0Mb/s。 在 发 

送 数据 包 之 前 ， 必 须 与 接收 者 进行 握手 ， 这 会 带 来 lms 的 延 时 。 如 果 你 决定 重新 设计 系统 ， 你 

可 以 减少 20% 的 延迟 或 增加 10% 的 速率 ， 哪 种 选择 更 好 ? 

某 总 线 长 80cm， 信 和 号 沿 着 它 以 真空 中 光速 的 70% 传输 。 如 果 打 开 总 线 驱 动 需要 2ns， 接 收 方 需 

要 Ins 的 建立 时 间 和 2ns 的 保持 时 间 ， 执 行 一 次 端 到 端 事务 需要 多 长 时 间 ? 

某 山顶 上 的 实验 室 位 于 基站 100 英里 以 外 。 与 基站 有 两 条 链 路 : 微波 链 路 以 光速 传输 数据 ， 有 

线 链 路 以 光速 的 三 分 之 二 传输 数据 。 为 了 安全 ， 你 决定 在 两 条 链 路 上 传输 普通 数据 流 。 由 于 传 

输 速度 的 差异 ， 基 站 在 收 到 有 线 数据 之 前 会 收 到 微波 数据 。 假 设 你 决定 在 与 有 线 数据 比较 之 前 

对 微波 数据 做 一 些 错误 处 理 。 当 每 个 操作 需要 2ns 时 可 以 执行 多 少 操作 ? 

ARM 环境 中 存储 器 映射 的 输入 设备 以 ABCD 的 顺序 返回 32 位 4 个 字 节 的 值 。 处 理 器 需要 以 

DCBA 的 顺序 使 用 这 些 字 节 。 写 一 个 ARM 代码 片段 来 实现 该 转换 。 

a. 使 用 非 复 用 地 址 的 并 行 总 线 的 优 缺 点 是 什么 ? 

b. NuBus 总 线 最 多 有 16 个 可 能 的 中 断 设备 。 编号 为 12、1、7 和 9 的 设备 都 同时 发 出 中 断 。 说 
明 每 个 设备 请 求 总 线 、 然 后 根据 分 布 式 仲裁 放弃 申请 或 者 保有 总 线 直 到 12 号 设备 胜出 时 ， 总 
线 上 发 生 的 动作 。 

分 布 式 仲裁 和 和 集中 式 仲裁 的 区 别 是 什么 ? 

某 总 线 具 有 750Q 的 特性 阻抗 。 其 终端 为 2000 的 电阻 。 终 端的 反射 系数 是 多 少 ? 

微 处 理 器 连接 在 传输 线 的 一 端 。 传 输 线 有 100Q 的 特性 阻抗 。 传 输 线 由 最 近 一 端的 微 处 理 器 驱 
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动 ， 其 阻抗 为 500 。 导 线 的 远 端 有 一 个 3000 的 电阻 。 

a. 总 线 每 个 端的 反射 系数 是 多 少 ? 

b. 在 总 线 的 远 端 ， 经 过 fs (总 线 的 端 到 端 传 播 延迟 ) 时 间 后 的 电 平 是 多 少 ? 也 就 是 说 ， 计 算 当 
初始 脉冲 到 达 终 点 时 总 线 远 端的 电压 。 

c. 如 果 微 处 理 器 发 出 5V 的 跨 步 电 压 ， 脉 冲 最 初 沿 着 总 线 传输 时 的 信号 幅度 是 多 少 ? 

解释 VMEbus 如 何 实现 仲裁 。 

VMEbus 指定 了 属于 VMEbus 标准 的 特性 ， 芯 及 禾 属 于 该 标准 的 特性 (例如 ， 总 线 释放 算法 的 

选择 )。 该 策略 的 优点 和 缺点 ( 即 强制 性 要 求 和 用 户 选 项 ) 是 什么 ? 

什么 是 原子 的 或 不 可 分 割 的 操作 (或 指令 )， 该 操作 为 什么 有 必要 ? 

为 什么 机 器 状态 在 中 断 调 用 中 需要 保存 ， 而 在 子 程序 调用 中 不 需要 保存 ? 

解释 为 什么 异步 串 行 RS232 接口 可 能 是 早期 个 人 计算 机 遭遇 的 最 大 不 幸 。 

某 计 算 机 的 平均 中 断 响应 时 间 为 p， 处 理 中 断 需 要 时 间 为 49， 中 断 返 回 需 要 时 间 为 s。 如 果实 现 

轮 询 中 断 机 制 ， 需 要 时 间 x 来 查询 设备 ， 时 间 y 来 服务 中 断 的 设备 ， 在 中 断 机 制 的 效率 低 于 中 

断 驱 动 IO 之 前 ， 允 许多 少 设备 被 查询 ? 

为 什么 在 实现 存储 器 映射 的 I/O 时 ， 超 标量 处 理 器 存在 特定 的 问题 。 如 何 解决 这 个 问题 ? 

存储 器 映射 的 1O 可 能 无 法 在 具有 .Cache 存储 器 的 系统 中 工作 。 为 什么 ”补救 措施 是 什么 ? 

为 什么 要 终止 SCSI BA? 注意 ， 这 同样 适用 于 其 他 的 总 线 。 

总 线 的 特性 阻抗 为 1009 。 必 须 用 最 高 的 电阻 来 终止 总 线 。 如 果 能 容忍 的 最 大 反射 脉冲 为 人 射 

脉冲 的 30%， 可 以 使 用 的 最 大 终端 电阻 是 多 少 ? 

什么 是 内 套 中 断 ? REP BAT ARAMA? 

以 太 网 物理 层 协议 代表 开 环 还 是 闭环 操作 ? 

USB 2.0 数据 链 路 接收 到 以 下 数据 流 。 实 际 的 源 数据 流 是 什么 ? 

000101111110111111011111101101111101111110111 

PCI Express 总 线 使 用 的 8b/10b 数据 编码 的 效率 比 使 用 其 他 数据 编码 的 要 低 20%。 为 什么 还 使 

用 它 ? 

在 计算 机 系统 中 USB 和 火线 作为 串 行 链 路 的 优 缺点 是 什么 ? 

为 什么 不 在 一 根 电缆 中 结合 USB 和 火线 来 实现 双赢 ? 你 认为 这 是 一 个 好 主意 吗 ? 

本 章 并 没有 介绍 蓝牙 无 线 接口 。 调 查 该 总 线 的 性 质 。 指 出 它 的 使 用 场合 ， 以 及 相对 USB 这 样 的 


有 线 总 线 和 WiFi 这 样 的 无 线 总 线 ， 它 的 优 缺点 。 


z=1000 


> R= 33.30 








注意 Z= Sh 总 线 源 端的 反射 系数 为 : : a 
(Z,-Zo)(Z.+Z)-(33.3~100)/(33. 3+100)=—(2/3)/(4/3)=-0.5. 
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